Python   发布时间:2022-04-02  发布网站:大佬教程  code.js-code.com
大佬教程收集整理的这篇文章主要介绍了Python采集《雪中悍刀行》视频弹幕,并且做词云图可视化分析大佬教程大佬觉得挺不错的,现在分享给大家,也给大家做个参考。

前言

最近已经播完第一季的电视剧《雪中悍刀行》,从播放量就可以看出观众对于这部剧的期待,总播放量达到50亿,可让人遗憾的是,豆瓣评分只有5.7,甚至都没有破6。

Python采集《雪中悍刀行》视频弹幕,并且做词云图可视化分析

很多人会把这个剧和《庆余年》做对比,因为主创班底相同

400余万字的同名小说曾被捧为网文界里的“名著”,不少粉丝早就对跨界改编有所期待,剧版的主创班底、出品方与2019年的爆款剧《庆余年》相同则放大了这份期待。然而《雪中悍刀行》播出后,书粉的怒火蔓延到了各类讨论场合。

今天就来采集这部剧的一部分视频弹幕,看看观众都说了啥,为什么播放量高,口碑却低

 

对于本篇文章有疑问的同学可以加【资料白嫖、解答交流群:910981974】

知识点介绍

  • requests模块的使用
  • pandas保存表格数据
  • pyecharts做词云图可视化

环境介绍

  • python 3.8
  • pycharm
  • requests >>> pip install requests
  • pyecharts >>> pip install pyecharts

代码实现

1. 导入模块

import@H_674_70@ re

@H_674_70@import@H_674_70@ requests     #@H_674_70@ 发送网络请求@H_674_70@
import@H_674_70@ pandas as pd #@H_674_70@ 保存数据@H_674_70@

 

2. 发送网络请求

headers = {
    @H_674_70@'@H_674_70@user-agent@H_674_70@'@H_674_70@: '@H_674_70@@H_996_99@mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/97.0.4692.71 Safari/537.36@H_674_70@'@H_674_70@
}
@H_674_70@#@H_674_70@ 构建一个列表储存数据@H_674_70@
data_list = []
@H_674_70@for@H_674_70@ page in@H_674_70@ range(15, 1500, 30):
    url @H_674_70@= f'@H_674_70@https://mfm.video.qq.com/danmu?otype=json&target_id=7626435152%26vid%3Dp0041oidttf&session_key=0%2C174%2C1642248894&timestamp={pagE}@H_674_70@'@H_674_70@
    esponse @H_674_70@= requests.get(url=url, headers=headers)

 

3. 获取数据 弹幕内容

json_data = response.json()

 

<Response [200]>: 告诉我们响应成功

4. 解析数据(筛选数据) 提取想要的一些内容 不想要的忽略掉

comments = json_data['@H_674_70@comments@H_674_70@'@H_674_70@]
@H_674_70@print@H_674_70@(comments)
@H_674_70@for@H_674_70@ comment in@H_674_70@ comments:
    data_Dict @H_674_70@= {}
    data_Dict[@H_674_70@'@H_674_70@commentid@H_674_70@'@H_674_70@] = comment['@H_674_70@commentid@H_674_70@'@H_674_70@]
    content @H_674_70@= comment['@H_674_70@content@H_674_70@'@H_674_70@]
    content @H_674_70@= re.sub(r'@H_674_70@[\x0e\xa0]@H_674_70@'@H_674_70@, ''@H_674_70@, content)

    data_Dict[@H_674_70@'@H_674_70@content@H_674_70@'@H_674_70@] = content
    data_Dict[@H_674_70@'@H_674_70@opername@H_674_70@'@H_674_70@] = comment['@H_674_70@opername@H_674_70@'@H_674_70@]
    @H_674_70@print@H_674_70@(data_Dict)
    data_list.append(data_Dict)@H_674_70@

 

5. 保存数据

df = pd.DataFrame(data_list)
@H_674_70@#@H_674_70@ 乱码, 指定编码 为 utf-8 或者是 gbk 或者 utf-8-sig@H_674_70@
df.to_csv('@H_674_70@data.csv@H_674_70@'@H_674_70@, encoding='@H_674_70@utf-8-sig@H_674_70@'@H_674_70@)

 

Python采集《雪中悍刀行》视频弹幕,并且做词云图可视化分析


Python采集《雪中悍刀行》视频弹幕,并且做词云图可视化分析

6. 词云图可视化

import@H_674_70@ jieba
@H_674_70@from@H_674_70@ pyecharts.charts import@H_674_70@ WordCloud
@H_674_70@import@H_674_70@ pandas as pd
@H_674_70@from@H_674_70@ pyecharts import@H_674_70@ options as opts

wordlist @H_674_70@= []
data @H_674_70@= pd.read_csv('@H_674_70@data.csv@H_674_70@'@H_674_70@)['@H_674_70@content@H_674_70@'@H_674_70@]
data

a @H_674_70@= [list(z) for@H_674_70@ z in@H_674_70@ zip(word, count)]
c @H_674_70@= (
    WordCloud()
    .add(@H_674_70@''@H_674_70@, a, word_size_range=[10, 50], shape='@H_674_70@circle@H_674_70@'@H_674_70@)
    .set_global_opts(title_opts@H_674_70@=opts.titleOpts(title="@H_674_70@词云图@H_674_70@"@H_674_70@))
)
c.render_notebook()@H_674_70@

 

Python采集《雪中悍刀行》视频弹幕,并且做词云图可视化分析

大佬总结

以上是大佬教程为你收集整理的Python采集《雪中悍刀行》视频弹幕,并且做词云图可视化分析全部内容,希望文章能够帮你解决Python采集《雪中悍刀行》视频弹幕,并且做词云图可视化分析所遇到的程序开发问题。

如果觉得大佬教程网站内容还不错,欢迎将大佬教程推荐给程序员好友。

本图文内容来源于网友网络收集整理提供,作为学习参考使用,版权属于原作者。
如您有任何意见或建议可联系处理。小编QQ:384754419,请注明来意。
标签: