京公网安备 11010802034615号
经营许可证编号:京B2-20210330
为何大数据预测对于奥斯卡来说不靠谱?
对于奖赛结果的预测,似乎已经成为了大众参与各类奖赛的方式之一。不管是世界杯、超级碗,还是总统选举,人们很喜欢搞个预测来自娱自乐。预测形式很多,包括人肉、章鱼、乌龟、大数据、人工智能等等,不管是数据专家、赌徒或是粉丝都乐于参与其中。
但在众多预测当中,又数奥斯卡的预测最难,最难以言中,为何你永远预测不到奥斯卡的结果?#蒙对不算#
在奥斯卡颁奖几天前,微软研究院经济学家戴维·罗思柴尔德也在他和他的团队开设的“聪明预测(PredictWise)”网站上公布了大数据预测结果,预测了本届奥斯卡最佳电影、最佳导演、最佳男女主角,以及最佳男女配角这些重头奖项的获奖者。在去年,这套系统全部24个奖项准确预测了其中20个。
罗思柴尔德使用的分析预测模型基于博彩市场、好莱坞证券交易所的大量数据建立,其预测结果会随着时间和数据的变化而更新。
但据Business Insider报道,数据分析预测网站538(FiveThirtyEight)生活方式主文案Walt Hickey透露,用来预测总统选举、体育赛事和国家经济的方法不能够用来预测奥斯卡,因为奥斯卡本身几乎是没有任何数据的。#没有数据,要怎么大数据#
奥斯卡的奖项产生是由6600名电影艺术和科学学会成员组成的匿名团体投票产生的,对这个团体建立数学模型进行奥斯卡评选结果预测向来不被看好,而测算全球影迷喜好与投票人以及提名影片的关联度也难度颇高。与业内权威人士观点相比,大数据的胜算貌似不大。
“你想要做民调或者调出以前的数据......但这些对于奥斯卡来说,压根就不存在。你想像下,学院(美国电影艺术与科学学院,该学院为奥斯卡评奖)里有6000多人,我们不知道他们都是谁,他们是被刻意匿名的,他们都不爱说话,我们也没有办法直接问他们‘对奥斯卡你怎么看’”,Walt Hickey补充道。
正是因为缺少具体数据,因此很难建立一个确定的预测模型,538网站为此次奥斯卡使用了一个基本模型并推荐了8种成熟的预测模型,供感兴趣的玩家参与预测。
“我们并不想管那个模型叫做奥斯卡奖项预测模型,因为我们网站也对此持怀疑态度,”Hickey表示。这个模型是“完全一成不变的。”
“我们之所以一直使用不变的模型,因为那些都是最基本、最简单的模型,”他说道。“它是最简洁最朴素的模型,对于任何比赛都采用相同的预测方法。”
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数据统计分析中,卡方检验是一种常用的非参数检验方法,核心用于判断两个或多个分类变量之间是否存在显著关联,广泛应用于市场 ...
2026-05-18在企业数字化转型的浪潮中,很多企业陷入了“技术堆砌”的误区——上线了ERP、CRM、BI等各类系统,积累了海量数据,却依然面临“ ...
2026-05-18小陈是某电商平台的数据分析师。老板交给他一个任务:“我们平台的注册用户已经突破1000万了,想了解一下用户的平均月消费金额。 ...
2026-05-18【专访摘要】本次CDA持证专访邀请到拥有丰富物流供应链数据分析经验的赖尧,他结合自身在京东、华莱士、兰格赛等企业的从业经历 ...
2026-05-15在数字化时代,企业的每一次业务优化、每一项技术迭代,都需要回答一个核心问题:这个动作到底能带来多少价值?是提升了用户转化 ...
2026-05-15在数据仓库建设中,事实表与维度表是两大核心组件,二者相互关联、缺一不可,共同构成数据仓库的基础架构。事实表聚焦“发生了什 ...
2026-05-15 很多数据分析师沉迷于复杂的机器学习算法,却忽略了数据分析最基础也最核心的能力——描述性统计。事实上,80%的商业分析问 ...
2026-05-15【核心关键词】互联网、机会、运营、关键词、账户、数字化、后台、客户、成本、网络、数据分析、底层逻辑、市场推广、数据反馈 ...
2026-05-14在Python数据分析中,Pandas作为核心工具库,凭借简洁高效的数据处理能力,成为数据分析从业者的必备技能。其中,基于两列(或多 ...
2026-05-14 很多人把统计学理解为“一堆公式和计算”,却忽略了它的本质——一门让数据“开口说话”的科学。真正的数据分析高手,不是会 ...
2026-05-14在零售行业存量竞争日趋激烈的当下,客户流失已成为侵蚀企业利润的“隐形杀手”——据行业数据显示,零售企业平均客户流失率高达 ...
2026-05-13当流量红利消退、用户需求日趋多元,“凭经验决策、广撒网投放”的传统营销模式早已难以为继。大数据的崛起,为企业营销提供了全 ...
2026-05-13 许多数据分析师精通Excel函数和SQL查询,但当面对一张上万行的销售明细表,要快速回答“哪个地区销量最高”“哪款产品增长最 ...
2026-05-13在手游行业存量竞争日趋激烈、流量成本持续高企的当下,“拉新”早已不是行业核心痛点,“留存”尤其是“付费留存”,成为决定手 ...
2026-05-12 很多数据分析师掌握了Excel函数、会写SQL查询,但当被问到“数据从哪里来”“数据加工有哪些步骤”“如何使用分析工具连接数 ...
2026-05-12用户调研是企业洞察客户需求、优化产品服务、制定运营策略的核心前提,而调研数据的可靠性,直接决定了决策的科学性与有效性。在 ...
2026-05-11在市场竞争日趋激烈、流量成本持续攀升的今天,企业的核心竞争力已从“获取流量”转向“挖掘客户价值”。客户作为企业最宝贵的资 ...
2026-05-11 很多数据分析师精通Excel单元格操作,熟练应用多种公式,但当被问到“表结构数据的基本处理单位是什么”“字段和记录的本质 ...
2026-05-11在互联网运营、产品优化、用户增长等领域,次日留存率是衡量产品价值、用户粘性与运营效果的核心指标,更是判断新用户是否认可产 ...
2026-05-09相关性分析是数据分析领域中用于探究两个或多个变量之间关联强度与方向的核心方法,广泛应用于科研探索、商业决策、医疗研究、社 ...
2026-05-09