一、生成歌词词云
率先咱们需要先获取通盘爬取到的歌曲的歌词,将他们合成字符串
随后索求其中的汉文,再合成字符串
之后使用jieba进行分词,并将其均分出来的长度大于等于2的词保存
接下来为生成的词云接受一张排场的图片,就不错运行生成了!
WordCloud参数中的contour_width=1, contour_color='lightblue’分歧为布景图片详细线条的粗细和形势,如若莫得成就则不会出现详细,font_path是用来指定字体的
生成后不错通过show展示也不错通过保存到土产货并翻开,最终狂放如下
二、热点歌手歌曲量饼图
率先是得回热点歌手列表以及热点歌手歌曲量
随后用每个歌手歌曲数目除以通盘这十个歌手的总歌曲数目,得到每个歌手歌曲量的占比
接下来不错接受成就哪一块凸起袒露,如图中周杰伦部分凸起袒露
如下只需要将凸起部分的值成就大即可
接下来就不错生成饼图了
其中x是歌曲量占比的列表,labels是对应的标签(在此图中则为歌手的姓名),explode即是上文提到的凸起袒露,这三个列表中的各个值是逐一双应的,autopct是成就占比数值的袒露口头,3.1f则暗意占宽为3位(如若大于会原样输出),精度为1的浮点数
一样不错接受径直show展示,草率保存到土产货再翻开
三、歌曲热度占比条形图
在之前咱们通过爬虫获取了top500的歌曲的信息(如下),现时咱们但愿对歌曲的热度进行分析,生成柱状图
后果图如下:
蓝本是念念生成歌手领有热点歌曲数目的柱形图的,然而阿谁爬取热点歌曲的网站中那些热点歌曲莫得对应的歌手,还需要我方再去其他网站得回每首歌曲对应的歌手,太缺乏了就没这样作念了,有兴趣的小伙伴不错我方完满一下
率先咱们要得回每个热度畛域的歌曲数目
底下的data列表即是对应x元组畛域的歌曲数目
咱们惟有通过遍历歌曲热度列表,每次齐在其data列表对应热度+1,最终即可得到每个热度畛域的歌曲数目
接下来即是创建柱状图,率先贬责汉文乱码问题
随后即可通过plt.bar创建,其中第一个参数为横坐标数据,第二个参数为纵坐标数据,第三个参数为为柱状图填充形势,第四个参数为透明度
title,xlabel,ylabel昭彰即是该柱状图的标题,横坐标和纵坐方向称呼