大数据网

让建站和SEO变得简单

让不懂建站的用户快速建站,让会建站的提高建站效率!

发布日期:2024-11-04 07:12    点击次数:148

一、生成歌词词云

率先咱们需要先获取通盘爬取到的歌曲的歌词,将他们合成字符串

随后索求其中的汉文,再合成字符串

之后使用jieba进行分词,并将其均分出来的长度大于等于2的词保存

接下来为生成的词云接受一张排场的图片,就不错运行生成了!

WordCloud参数中的contour_width=1, contour_color='lightblue’分歧为布景图片详细线条的粗细和形势,如若莫得成就则不会出现详细,font_path是用来指定字体的

生成后不错通过show展示也不错通过保存到土产货并翻开,最终狂放如下

二、热点歌手歌曲量饼图

率先是得回热点歌手列表以及热点歌手歌曲量

随后用每个歌手歌曲数目除以通盘这十个歌手的总歌曲数目,得到每个歌手歌曲量的占比

接下来不错接受成就哪一块凸起袒露,如图中周杰伦部分凸起袒露

如下只需要将凸起部分的值成就大即可

接下来就不错生成饼图了

其中x是歌曲量占比的列表,labels是对应的标签(在此图中则为歌手的姓名),explode即是上文提到的凸起袒露,这三个列表中的各个值是逐一双应的,autopct是成就占比数值的袒露口头,3.1f则暗意占宽为3位(如若大于会原样输出),精度为1的浮点数

一样不错接受径直show展示,草率保存到土产货再翻开

三、歌曲热度占比条形图

在之前咱们通过爬虫获取了top500的歌曲的信息(如下),现时咱们但愿对歌曲的热度进行分析,生成柱状图

后果图如下:

蓝本是念念生成歌手领有热点歌曲数目的柱形图的,然而阿谁爬取热点歌曲的网站中那些热点歌曲莫得对应的歌手,还需要我方再去其他网站得回每首歌曲对应的歌手,太缺乏了就没这样作念了,有兴趣的小伙伴不错我方完满一下

率先咱们要得回每个热度畛域的歌曲数目

底下的data列表即是对应x元组畛域的歌曲数目

咱们惟有通过遍历歌曲热度列表,每次齐在其data列表对应热度+1,最终即可得到每个热度畛域的歌曲数目

接下来即是创建柱状图,率先贬责汉文乱码问题

随后即可通过plt.bar创建,其中第一个参数为横坐标数据,第二个参数为纵坐标数据,第三个参数为为柱状图填充形势,第四个参数为透明度

title,xlabel,ylabel昭彰即是该柱状图的标题,横坐标和纵坐方向称呼






Powered by 大数据网 @2013-2022 RSS地图 HTML地图

Copyright Powered by站群 © 2013-2024