大佬教程收集整理的这篇文章主要介绍了《长津湖》、《我和我的父辈》,Python国庆档影评分析,大佬教程大佬觉得挺不错的,现在分享给大家,也给大家做个参考。
读者朋友们大家好啊c;我是小张~
国庆小长假昨天就已将结束了c;我们呢c;也各自回到自己的工作岗位c;继续开启我们的努力搬砖( 摸鱼)生活
从19年开始c;每逢十一就会上映一部以 我和我的* 主题的电影来喜迎国庆c;并且按照前两年票房趋势c;这部电影的欢迎程度远大于同时期上映的其它电影c;票房稳居第一
今年也不例外上映了一部《我和我的父辈》c;以4个 片段来讲述父母与孩子之间的故事c;内容也受到大众的肯定;
但令人意外的是它的票房c;要远低于另一部国庆档《长津湖》c;热度和好评数原高于前者c;关于其中的具体细节c;本文以此来做个影评分析
本文挑选了在今年国庆上映三部电影c;分别是《我和我的父辈》、《长津湖》以及《五个扑水的孩子》
《五个扑水的孩子》这部电影许多读者可能是第一次听到c;热度远不及前两部c;但它的确是在今年国庆期间上映的c;而且根据猫眼排名c;热度还不低c;位居第三
开始之前c;先说下本文所用到的技术栈c;主要分为以下两方面:
语言:Pythonc;javascript;
库: echartsc;styleCloud;
首先是从影评角度来分析一下c;这里借助 Python 获取到三部电影的在豆瓣上的部分影评c;关于豆瓣影评的爬取c;这里我就不过多介绍了c;不太熟悉的参考旧文:c;核心代码贴在下方:
@H_772_41@headers = { "Cookie":"bid=tulFhUK9Lzo; douban-fav-remind=1; ll="118160"; _vwo_uuid_v2=D55143433EAF6AF4EB29A904F8BE781A1|4d5d27125abfe3f6d29caa68ba504fed; ap_v=0,6.0; _pk_ref.100001.4cf6=%5B%22%22%2C%22%22%2C1632849782%2C%22https%3A%2F%2Fwww.google.com%2F%22%5D; _pk_ses.100001.4cf6=*; __utma=30149280.52492667.1628212627.1629608096.1632849782.3; __utmc=30149280; __utmz=30149280.1632849782.3.3.utmcsr=google|utmccn=(organiC)|utmcmd=organic|utmctr=(not%20provided); __utma=223695111.788106722.1629608096.1629608096.1632849782.2; __utmb=223695111.0.10.1632849782; __utmc=223695111; __utmz=223695111.1632849782.2.2.utmcsr=google|utmccn=(organiC)|utmcmd=organic|utmctr=(not%20provided); __utmb=30149280.3.10.1632849782; _PK_ID.100001.4cf6=254979423a09aae4.1629608097.2.1632851386.1629608485.", "user-Agent":"Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/94.0.4606.61 Safari/537.36", "Accept-Language": "zh-CN,zh;q=0.9,en-US;q=0.8,en;q=0.7,zh-TW;q=0.6", "Accept":"text/html,application/xhtml+xml,application/xml;q=0.9,image/avif,image/webp,image/apng,*/*;q=0.8,application/signed-exchange;v=b3;q=0.9" } # #Part1 数据爬取改一下 id 即可 moviEID = "35030151" for offset in range(0,220,20): url = "https://movie.douban.com/subject/{}/comments?start={}&limit=20&status=P&sort=new_score".format(@H_819_43@moviEID,offset) res = requests.get(url,headers= headers) # print(res.text) soup = BeautifulSoup(res.text,'lxml') time.sleep(2) for comment_item in soup.SELEct("#comments > .comment-item"): try: data_item = [] avatar = comment_item.SELEct(".avatar a img")[0].get("src") name = comment_item.SELEct(".comment h3 .comment-info a")[0] rate = comment_item.SELEct(".comment h3 .comment-info span:nth-child(3)")[0] date = comment_item.SELEct(".comment h3 .comment-info span:nth-child(4)")[0] comment = comment_item.SELEct(".comment .comment-content span")[0] # comment_item.get("div img").ge data_item.append(avatar) data_item.append(str(name.String).Strip("t")) data_item.append(str(rate.get("class")[0]).Strip("allstar").Strip('t').Strip("n")) data_item.append(str(date.String).replace('n','').Strip('t')) data_item.append(str(comment.String).Strip("t").Strip("n")) data_json ={ 'avatar':avatar, 'name': str(name.String).Strip("t"), 'Rate': str(rate.get("class")[0]).Strip("allstar").Strip('t').Strip("n"), 'date' : str(date.String).replace('n','').replace('t','').Strip(' '), 'comment': str(comment.String).Strip("t").Strip("n") } if not (collection.find_one({'avatar':avatar})): print("data _json is {}".format(data_json)) collection.insert_one(data_json) except Exception as e: print(e)
首先呢c;我们先看下关于这三部电影的评论在每个时间段有没有数量方面的差异c;于是就有了下面@H_772_41@图1
根据@H_772_41@图1可视化结果来看c;三部电影的评论趋势是一致的c;从 24日开始评论数慢慢增加c;到 30 日达到高峰c;之后慢慢回落;
这个趋势也比较合乎常理c;30日及30日之前的评论都可以被认为是用户看完点映之后反馈c;也是出品商为了利益最大化c;为电影增加热度的一种方式
但是这里面比较大的一个问题是 评论数量对比c;根据这个折线图显示c;《五个扑水的少年》的评论数远大于《长津湖》和《我和我的父辈》c;无论影评好坏c;根据传播学的角度前者的热度要远高于后者c;而后面票房对比结果却恰恰相反c;至于为什么出现这种趋势c;还请大家细品c;c;只能说《长津湖》出品方是真的自信c;评论热度低c;但票房却很出众
与影评相关的星级分布c;在这里我也做了个简单对比c;《少年》、《长津湖》、《父辈》(这里偷个懒c;都用简称来替换 ) 可视化效果见@H_772_41@图2c;@H_772_41@图3、@H_772_41@图4
从结果来看c;《长津湖》的受欢迎程度最高c;从采集到的样本中c;五星级好评占比高达 45.93c;近一半的比例c;其次是《父辈》占据29.05c;最后是《少年》 22.6;
但目前在豆瓣上评分是这样的c;《长津湖》 7.6c;《父辈》:7.0c;《少年》7.3c;虽然豆瓣影评相对会权威一些c;但对这个评分我还是持有怀疑态度c;至于原因的话就是后面的票房缘故;
关于一部电影的好坏c;只看评分是没有意义的c;毕竟评分根据资本的力量是可以改变的c; 一部电影最终受不受欢迎c;核心的还是票房c;看用户愿不愿意为这部影片支付一张电影票的价格
下面的票房数据来源于猫眼c;根据三部电影的票房数据我绘制了两个图表c;一个是当天的票房数c;一个是自上映日开始的累计票房
当天票房数统计结果见@H_772_41@图5
看到这个表之后我惊了个呆c;如果不加入《票房》统计这一维度的对比c;原以为《少年》与前两部就有差距c;但不会差别特别大c;看完这个表的数据之后c;发现自己还是太年轻了c;《少年》的票房与另外两部电影基本没有可比性
在10月6日这一天c;《五个扑水的少年》的票房约500多万c;而《长津湖》这一天单日票房仅 4.75亿c;这之间相差近 90倍
除了单日票房外c;这里对三部影片的累计票房走势也绘制了一个折线图c;结果见@H_772_41@图6
截止到10约6日c;《长津湖》票房数累计 28亿c;《父辈》累计 8.7亿c;而《少年》仅有 0.3 亿左右;
如果说《长津湖》是呈45度直线向上c;那么《我和我的父辈》票房走势角度只有 30度c;甚至不足于30度;而《五个扑水的少年》的票房走势呈水平状态c;是真的惨;
影评分析到这里不由地会想起一句话:旱的旱死c;涝的涝死;可能一些出电影厂商特地会把电影放在@H_772_41@国庆、@H_772_41@春节 这种大流量的节日中c;投资将很可能带来几倍甚至几十倍的收益;
但从上面票房对比来看c;这个策略不见得很明智c;除非影片很受大众的肯定和喜欢c;否则可能不但没有收益而且连前期投入的成本都收不回来
《我和我的父辈》作为国庆档预期较高的一部影片c;本以为票房会略低于《长津湖》c;但从上面走势来看c;《父辈》离后者还是有不小的差距;
侧面也可以看出c;如今大众群体对于好的电影绝不会吝啬c;对于看电影这一娱乐方式我们绝不会亏待自己c;但是看一部低质量影片c;我们是不能容忍的
最后c;将每一部电影的影评绘制为一张词云图c;看看对于每部电影c;观众们都说了什么
在《长津湖》的影评中c;提到最多的是@H_772_41@历史、@H_772_41@志愿军、@H_772_41@战争片、@H_772_41@美军、@H_772_41@震撼 等关键词;而这几个关键词确实与电影题材相符合c;彰显现在美好生活的来之不易
在《我和我的父辈》中c;@H_772_41@沈腾、@H_772_41@吴京 两个导演的名字占据整张词云图的一大部分c;受到观众们的喜欢;而对于这部剧的剧情方面的评价c;出现最多的就是@H_772_41@浪漫、@H_772_41@喜剧、@H_772_41@感动c;虽然情感方面相差较大c;但衬托出四位导演之间的不同风格;
@H_772_41@原版、@H_772_41@翻拍、@H_772_41@改编、@H_772_41@国产是《少年》这部剧的题材基调c;而除此之外并没有看到与这部剧剧情相关的情感评价c;也并没有什么好讨论的了c;
关于本篇文章中的代码和数据的获取方式:关注微信公众号:小张Pythonc;后台回复关键词:211009 即可获取
今年国庆档的影评分析到这里也就结束了c;总的来说可以用一句话来概括:以前影片出品方能凭借炒作、前期流量IP宣传为票房创造不少收益c;而这种情况在现在很少会发生c;现在的观众已经不再那么好糊弄的了
以上是大佬教程为你收集整理的《长津湖》、《我和我的父辈》,Python国庆档影评分析全部内容,希望文章能够帮你解决《长津湖》、《我和我的父辈》,Python国庆档影评分析所遇到的程序开发问题。
如果觉得大佬教程网站内容还不错,欢迎将大佬教程推荐给程序员好友。
本图文内容来源于网友网络收集整理提供,作为学习参考使用,版权属于原作者。
如您有任何意见或建议可联系处理。小编QQ:384754419,请注明来意。