城市直播房产教育博客汽车
投稿投诉
汽车报价
买车新车
博客专栏
专题精品
教育留学
高考读书
房产家居
彩票视频
直播黑猫
投资微博
城市上海
政务旅游

烂番茄哪家网站的电影评分更靠谱过年囤片清单

5月5日 拭朱砂投稿
  我们在选择看哪一部电影时,通常会考虑很多个因素,比如导演是谁、演员是谁,或者电影的预算是多少。大部分人都是基于影评、预告片做出决定,或者直接根据电影的评分来决定。
  出于某些原因,有些人不愿意看影评或预告片,尽管它们比评分提供了更多的信息。
  首先,他们不想被剧透,哪怕是只有一点点的剧透也不行。
  其次,他们不希望观影体验受到任何影响。因为影评里通常会包含剧照,这些剧照一旦映入人类的大脑中,他们就很难做到在观影时不受任何影响。
  另外,有些人可能很忙或者很累,不想看任何影评,哪怕是2分钟的预告片也不想看。
  所以,在大多数情况下,电影评分对于很多人来说似乎是最好的方案。
  这篇文章旨在为大家推荐一个网站,能够准确、快速地获得电影评分,而且背后有强大的数据做支撑。
  最佳网站的标准
  我们要做的就是以某些标准为基础,向大家推荐能够获得电影评分最好的网站,比如什么样的可以称得上更好,什么样的算更差或最差,什么样的是最好。在我看来,唯一可用的标准就是正态分布。
  好的电影评分网站应该接近于正态分布,也就是说:在某段时间内给定一组值,大部分值位于中间,少部分值处于两极。正态分布(也叫高斯分布)看起来是这样的:
  这一标准背后的原理是什么呢?我看过几百部电影:
  有些电影非常好,我看了好几遍。
  有些电影很糟糕,我后悔花时间看它们。
  大部分的电影处于平均水平,我甚至已经想不起它们的情节。
  我相信大部分人不管是影评家、影迷或者普通观影者都有类似的经历。
  如果说电影评分确实能够反映电影的质量,那么电影评分也应该符合正态分布。
  既然我们看过的电影中大部分都处于平均水平,那么在分析电影评分时,也应该出现相同的模式。
  这里的每个长条与一个评分对应,长条越长表示电影评分越高。
  如果你还不接受这两种模式之间的相似性,可以想想单部电影评分的分布情况。有很多人会对电影进行评分,而在大多数情况下,他们会做出类似的选择。他们要么觉得电影很差,要么一般,要么很好。
  如果对单部电影的评分进行可视化,我们极有可能看到评分聚集在以下三个区域中的某一个:低分、平均分或高分。
  因为大部分电影都处于平均水平,所以聚集在平均区域的可能性最大。
  不出现聚集的情况是很少见的,也就是说评分在这三个区域平均分布。
  因此,具有大量样本的电影评分的分布应该接近于正态分布,也就是平均区域出现聚集,两边的条形长度越来越低,最后收敛。
  如果这些难以理解,可以看下面这张图:
  请注意likely和verylikely之间的区别
  IMDB、RottenTomatoes、Fandango,还是Metacritic?
  在给定了标准之后,我们开始进入数据环节。
  有很多网站提供了自己的电影评分。我根据它们的知名度从中选出了4个网站,分别是
  IMDB(http:www。imdb。com)
  Fandango(http:www。fandango。com)、
  RottenTomatoes(https:rottentomatoes。com)
  Metacritic(http:www。metacritic。com)。
  对于后面两个网站,我主要使用它们的标志性评分tomatometer和metascore,主要是因为它们对于用户来说具有更高的可见性(也就是说用户更容易看到它们)。这两种评分也会分享在另外两个网站上(IMDB上有metascore,Fandango上有tomatometer)。
  我收集了在2016年和2017年拥有评论最多的电影,总共214部,可以从
  GitHub(https:github。commircealexMovieratings201617)
  上下载这些数据集。
  我没有收集2016年之前的电影,因为Fandango的评分系统在WaltHickey提出质疑之后做了些许改动,我会在后面做出说明。
  首先,让我们来定义质量分数:从1到10,0到3分表示电影不好,3到7分表示电影一般,7到10分表示电影很好。
  要注意质量和数量之间的差别。为了保持可辨识度,我把数量评级分为低、平均和高,而电影的质量用坏、平均和好来表示。
  现在让我们来看一下分布情况:
  每一种评分都有其独特的地方。对于IMDB和Fandango来说,每条长条之间的相隔0。5,而其他两个每条长条间隔5。
  乍一看,metascore的柱状图更接近于正态分布,它的平均区域聚集了大部分的长条,这些长条的高度是不规则的,让整个图的顶部看起来既不钝也不尖。
  不过,中间部分比两边高,而且比两边多,长条的高度向两边逐渐降低。也就是说,metascore的大部分值处于平均范围,正是我们想要的类型。
  IMDB的大部分长条也分布在平均区域,但很明显向高区域倾斜,而低区域几乎是空的,所以这样的结果需要打个问号了。
  一开始我把这种结果归咎于样本数据量太少,以为更多的样本可以让IMDB的结果更准确些。所幸的是,我在Kaggle网站上找到了一个数据集(https:www。kaggle。comdeepmatriximdb5000moviedataset),里面包含了IMDB网站4917部电影的评分。使用这个数据集得出的结果如下图所示:
  结果与小样本数据量极为相似
  大数据量的分布情况与小数据量的分布情况几乎一样,只是在低区域出现了少量的长条(只有46部电影,相比4917的总量相去甚远)。大部分的值仍然处于平均区域,所以IMDB还是有一定的参考价值,但因为出现了倾斜,还是无法与metascore的结果相提并论。
  不管怎样,我们可以得到一个结论,就是完全可以基于我所给出的214部电影评分样本来分析整体的分布情况。换言之,我们有理由相信,基于少量样本得出的分析结果与基于这四个网站所有电影评分得出的分析结果是一样的至少是相似的。
  既然如此,接下来让我们来分析一下Fandango的数据分布情况。数据仍然向高区域倾斜,平均区域的左半部分几乎是空的,低区域也是空的。可见,它的分布情况与我们的标准差距太大。所以,我不推荐Fandango。
  tomatometer的数据分布很平坦,与其他三个网站的不太一样。tomatometer的评分体系也很独特,它表示的是评论者给出正面评价的百分比,所以很难用差、平均、好这样的标准来衡量,它对应的评价结果要么是好,要么是不好。
  不管怎样,我猜想它的最终结果仍然会接近于正态分布,大部分电影的正面评价和负面评价的数量差距很有限,只有少部分电影之间的评价差距比较大。
  但从tomatometer的分布图来看,它并不符合我们的要求。或许使用大数据量可以让其结果更有说服力,但即使是这样,我仍然不推荐它,因为它的评价系统只能分出好与不好。
  综上所述,从分布情况来看,我推荐的是metascore。
  不过,如果对低、平均、高这三个区域稍作调整,IMDB的结果也是可以考虑的。如果是这样的话,那么仅通过数量分布图就得出应该推荐metascore的结论就不是很有说服力了。
  因此,我决定使用质量来区分二者。
  我的想法是这样的:使用Fandango的变量作为负参考,然后看看IMDB和metascore哪个变量与之具有最小的相关性(我之所以把它们叫作变量,因为它们的值是可变的例如,metascore的值根据不同的电影会有所变化)。
  我会计算出简单的相关性系数,具有较小值的变量就是我要推荐的了(我会解释这个相关性系数的原理)。不过,在这之前,先让我简单地解释一下为什么要使用Fandango的变量作为负参考。
  Fandango的用户对电影偏爱有加
  之所以选择Fandango作为负参考,是因为它与正态分布差距最大,明显向高区域倾斜。
  另一个原因是WaltHickey对Fandango提出过质疑(https:fivethirtyeight。comfeaturesfandangomoviesratings)。2015年10月,Hickey对类似的分布情况感到很疑惑,最后发现Fandango网站总是将评分往更高的值进行四舍五入(例如,4。1会被四舍五入成4。5,而不是4。0)。
  Fandango团队后来对他们的评分系统进行了更正,并告诉Hickey说,网站的评分逻辑确实是个bug,不过移动端不存在这个问题。不过即使经过更正,结果仍然没有太大变化,所以我仍然会把它作为负参考。
  更正之后的变化:
  我把其他类型的评分也转成0到5分的形式,并以0。5为基准进行了四舍五入。FTE表示FiveThirtyEight,当时Hickey在他的文章中提到了这个缩写。
  现在我们进一步查看Fandango的分布:
  蓝色的长条表示2017年的数据,红色表示2015年的数据。
  metascore和IMDB哪个与Fandango具有更低的相关性?
  结果是metascore与Fandango具有更低的相关性。它的Pearson相关性系数值是0。38,而IMDB是0。63。
  现在让我来解释一下这是怎么回事。
  两个变量的值会发生变化,如果在二者之间能够找到某种模式,那么说明它们之间存在一定程度的相关性。所以,衡量相关性就是要看这种模式达到了什么程度。
  一种方式是通过Pearson相关性系数来衡量。如果系数值是1。0,表示具有完美的正相关,而1。0表示完美的负相关。
  系数越是接近0,表示相关性程度越低。
  如下图所示:
  组成各种形状的小点就是指电影的评分变量。
  根据上述的相关性系数,Fandango和IMDB之间的模式程度比Fandango和metascore之间的模式程度更深一些。两个系数都是正数,也就是说,相关性都是正向的,只是IMDB比metascore更高一些。
  换句话说,对于Fandango上出现的电影评分,metascore与之相关性要比IMDB低。
投诉 评论 转载

烂番茄哪家网站的电影评分更靠谱过年囤片清单我们在选择看哪一部电影时,通常会考虑很多个因素,比如导演是谁、演员是谁,或者电影的预算是多少。大部分人都是基于影评、预告片做出决定,或者直接根据电影的评分来决定。出于某些……别吃亏向领导汇报不及时上这五件事一定要很多人就怕向领导汇报工作,总害怕和领导对眼光,不是自己内心空虚,也不是自己害怕领导,而是有一种自卑的心态在作怪,如果你也遇到这种情况,大家一定要牢记,下面这五件事情,不管你对领……瑞幸卖的根本不是咖啡在美股上市,用美国投资者的钱来补贴国内消费者的民族之光瑞幸咖啡,就这么崩了所有人都看呆了。伪造交易22亿!瑞幸咖啡盘前跌超80,开盘后直接熔断。新闻事实这里不表述了……韩红是同性恋吗韩红管彤美国结婚了吗管彤个人资料著名歌星韩红的性向一直都是网友热议的话题之一,性取向一直都是谜,最近更是传出了韩红和管彤注册结婚的事情,瞬间在网上引发热议。因为截图中有著名脱口秀主持人黄西的转发,并配以恭喜,……父爱小时候,我总是感觉父亲是个严厉并且丝毫不会表达他对我的爱的一个人,每天都让我抱着那令人厌烦的学习充实自己。直到四年前的那一天,我对父亲的认识完全改变了。记得那是周五……致广大茶人朋友们的一封信茶友茶商请注意:因地处老挝边境,今年勐腊易武比较特殊,前往时需要有核酸检测或当地人帮开的村委会通行证明。以下文案复制自公众号:中国贡茶第一镇易武致广大茶人朋友们的一……野外游玩受伤如何快速止血随着人们生活水平的提高,出门旅游已经成为了一种大众化的娱乐方式。我们在假期的时间常去参加一些户外活动,陶冶情操,亲近大自然。但是我们在外出旅行的时候常会有意外受伤的情况。那么野……儿童防丢器定位存在误差吗人防丢的需求从儿童开始,相信只要看过电影《亲爱的》,一定会对儿童丢失这个事儿印象深刻,出于让儿童更安全的目的,各式各样的儿童防丢设备被设计了出来,那么儿童防丢器定位存在误差吗?……冯志远观后感看完一部作品后,相信你会有不少感想吧,不妨坐下来好好写写观后感吧。快来参考观后感是怎么写的吧,以下是小编精心整理的《冯志远》观后感,欢迎阅读与收藏。9月13日下午,……白薇细小的春天细小的春天文白薇三月的日历里有惊蛰和春分。《黄帝内经》里说:春三月,天地俱生,万物以荣。此时的江南一定已是草长莺飞、烟柳如织了,而我位于华北平原的家乡,清晨的……用尽全力,就能在生活的缝隙中寻觅到浪漫微光的羽翼人生永远是这个道理:在意的越多,遇到的麻烦就会越多。什么都不在乎的人,反倒一点麻烦都没有。苏芩貌似是一夜的雨!昨天一家人没有出门,除了大女儿上了一……如何让工作经验提亮你的简历来自:51job夏日小悠冗长且毫无重点的简历怎能抓住HR的心?简历上写什么才能吸引HR的眼球?当然是让人眼前一亮的能力特长,或是恰好与该职位匹配的技能。根据前程无忧……
拔步床清洗及保养方法拔步床选购小窍门胡生明过年有感纸质玩具如何消毒集团化办学要避免千校一面的走向户外运动手表的三大品牌谁为谁心疼治疗男性不育都有哪些误区要认清想太多,就是折磨自己文坛造句用文坛造句大全妊辰纹什么时候开始长怎么消除呢家的声音单身了我们还有力气去爱吗

友情链接:中准网聚热点快百科快传网快生活快软网快好知文好找江西南阳嘉兴昆明铜陵滨州广东西昌常德梅州兰州阳江运城金华广西萍乡大理重庆诸暨泉州安庆南充武汉辽宁