上海堡垒是烂片吗?数据一览
《上海堡垒》于2019年8月9日上映,上映之后口碑一路走低。猫眼评论区充斥着半星及一星评分,猫眼都这种评价毫无疑问是烂片了,在微博上也都在疯狂吐槽这部电影。空口无凭,让我们通过数据看看网友们都是怎样评价这部电影的。开始之前我们先观摩一番电影海报,如下。

话不多说上数据,截至8月11日16点猫眼共31万人评分,得分三星 5.8 分,网友讨论数共 83456 条。接下来我们将从取得的 2019-08-11 02:44:21 到 2019-08-09 22:33:33 之间共 28302 名网友的猫眼评论数据,从评论内容、用户所在城市分布及性别等方面分析观众对这部电影的评价。本文使用的所有数据从采集到分析都使用 Python 进行。
评论内容
评论内容是电影评价中最重要的内容。得益于移动互联网的发达,网友们可以随时随地在评论区留言,可以最直接的反映出观众在观影后的感受,或满意或失望。
因为评论内容较多,将使用 jieba 分词结合词云(WordCloud)通过高频词汇的方式展现网友的观点。对近三万评论进行分词及过滤得到的词云如下图:

通过词云显示“特效”是评论中最高频的词汇,毕竟特效是科幻电影中的基本元素,对此类电影观众也比较看重特效带给人的感受;除了特效之外,从此云中可以看出电影中最重要的“剧情”以及演员的“演技”也是被观众看重的部分,一般来说我们评价一个东西会用 名词+形容词 的方式,词云中和“剧情”及“演技” 词频相近的形容词有 “不错”、“可以”,难道电影剧情和演技还不错、还可以??? 不过评论只是一个方面,而且词云上的词都是经过分词得到的简单词汇,中华文化博大精深,未经过语义分析仅从简单的名词及形容词上得到的好坏评价还是有差异的。
其次,在好评中比较多的的有“好看”、“不错”等;差评也同样不少有“垃圾”、“烂片”等。但是从词频来看高分好评与低分差评似乎差别不大。
在演员方面,关注度最多的是主演“鹿晗”及其饰演的角色“江洋” , “舒淇”及其饰演的 “林澜”也有出现。
用户评分
接下来我们看评价中最直观重要的 “评分”,猫眼的评分可以打0.5分(半星)这点与豆瓣有所不同。评分方面不用多说大家心里应该也有数,,直接看图:

从图中不难看出评分出现两极分化:高分与低分数量接近,中间分数相对平均,这点与之前词云显示一致。之所以评分出现两极分化,我推测是电影上映时间较短而且鹿晗粉丝效应明显,刚开始去观影的人群中粉丝占比较大故高分较多,随着时间的推移普通观众的比例开始增长,电影的真实性评分开始凸显。
用户所在城市分布

不出所料,北上广深作为一线城市排名前列,还有像成都、重庆、武汉、西安这样的二线城市紧随其后。这些经济实力较强的城市,文娱设施健全且观众基数较大,即便存在电影可能会存在一些问题,也还是有较多用户选择前往电影院先睹为快。
用户性别分布

参与评论的用户中有 46% 不愿透露性别,剩余男性占 30%,女性占 23%。
至于这部电影烂不烂大家心里有数,看电影图一乐呵。