京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据助推大电影迎来全民娱乐时代
近两年,大数据越来越成为一个时髦的名词,但是,互联网公司到底能为电影行业提供什么样的有效数据,电影人该如何最有效地使用大数据?
昨日,是上海电影节正式开幕第一天,由淘宝电影、娱乐宝、新浪三方联合主办的“大数据助推大电影”论坛上,来自互联网各领域资深人士以及演员徐峥,一同探讨了互联网生产的大数据如何更好地为传统电影行业和电影人服务。
你刷微博吐槽电影时
制片人可能因为你修改剧本
微博CEO王高飞表示,微博两亿月活跃用户里,电影最受关注。每个月微博上有8000万用户讨论电影,另外还有200多位粉丝过千万的明星大V,他们都是电影大数据的来源。未来微博将通过跟蚂蚁金服、娱乐宝的合作,做电影和粉丝之间的连接器。
而现在电影公司拍电影,很大一部分也都会运用预测系统,通过对票房的预估来决定片子做不做。爱奇艺高级副总裁杨向华指出,爱奇艺的数据和系统磨合需要一段时间,目前能达到约80%的准确度,剩余20%要依靠人工调整。从制作层面,可以用大数据分析什么题材、什么阵容的演员会被用户喜欢;在项目阶段,可以进行票房预测;在销售阶段,可以调查应该针对什么人群做什么样的营销;最后在发行阶段,也可以通过检测微博搜索量来测试观众期待值,为影城经理排片提供依据。
优酷土豆集团高级副总裁、合一影业CEO朱辉龙表示,去年《后会无期》和《小时代3》同期竞争,两部电影的物料都在网上引起很大反响。优酷土豆通过对后台会员数据的分析,决定深入内陆城市重点宣传,收获了很好的效果。同理,分析《老男孩》的用户关键词,排在第一的是音乐,所以《小苹果》应运而生,没想到最后歌比电影还火。
徐峥以导演创作角度发言,他认为在拍摄前,制片方可以通过大数据评估改进剧本,甚至对电影票房有所预估。电影定剪之前,也可以请专业人士来提前观影并进行完善。
蚂蚁金融服务集团国内事业群总裁樊治铭畅想,支付宝的消费数据,加上新浪微博的行为数据将为电影排片带来指导。未来淘宝和支付宝将利用LBS定位系统,打通数据和电影院,将最新观影信息即时发给观众,充分利用比如白天人流较少的上班时间,降低电影票价,为消费者提供实惠。
UTA亚太区负责人Max Michael则介绍了好莱坞的大数据分析体系,称美国有尼尔森这样的评级公司,有UTA研发的专业软件,各个公司自己也普遍对社交媒体进行追踪,会及时根据用户反馈作出调整。
《港囧》定档中秋节
大数据已经做好票房预估
在活动现场,嘉宾们以过去的微博和淘宝电影的大数据统计结果,对即将上映的《港囧》来了一次实战分析:《港囧》定档9月25日,今年中秋加国庆档票房大盘预计将达17到20亿,《港囧》能分到多少成为关注焦点。
大数据分析,喜剧是国庆档最受欢迎的类型,今年也没有同类型其他影片竞争,《港囧》票房前景可期。现场数据显示,射手、狮子、水平、天蝎、白羊都会去电影院捧场,处女座和摩羯座则是最有可能不去的人。对此,徐峥也大笑道:“那完了,宁浩和黄渤都是处女座,陶虹是摩羯座,他们都没机会看了。”
当谈到受众群在城市分布的问题时,徐峥表示,“其实我觉得如果中国的电影的定位准确的话,真的有可能战胜好莱坞的。我们在做《心花路放》的时候,认为这部电影在三四线城市一定会非常受欢迎,因为里面讲到了小城青年的元素,离他们的距离是很近的,现实感是很强的。”
而徐峥在拍摄上一部作品《泰囧》时,大数据还不像今天那么流行,但是在看过数据分析后,徐峥认为,在今年即使上映的《港囧》中,可以借鉴许多此次大数据的分析结论,对大数据显示的票房增量大的城市展开重点宣传。
同时,他表示,这次会拉上赵薇一块为《港囧》多跑跑三线城市。徐峥自认为目前还无法预测《港囧》的票房数字,原因是“国庆档还有很多其他的电影,《心花路放》时是一枝独大,但《港囧》就不知道了”。
大数据
不能完全代替人为决策
不过,大数据也是一把双刃剑。嘉宾们表示,大数据说到底只是一种分析工具和手段,不能完全代替人为决策,更何况电影作为一门艺术本来就应该保留一定的直觉和坚持。
那么运用大数据需注意什么?王高飞表示,微博在社交媒体中起到的是放大器的作用,但如果你电影本身的价值是0,后面再加多少个0都没有用;只有前面的数字有价值,后面0的放大才有用。
同样,朱辉龙表示:“数据是理性的,但决策是感性的,大数据不是万能的,即便用也要用真正场景化的数据,不能只看孤零零的数字。”杨向华则称,想让大数据完全代替人工分析,还有很长一段路要走。
然而现场也有观众提出疑问,现在选择电影存在随机性,这种情况下大数据是不是就无用武之地了?樊治铭对此回答:现在冲动消费已经越来越少了,因为现在微博等移动互联网的信息很方便获得,而且现在看电影的主要人群是“70后”、“80后”和“90后”,这些人大多对网络非常依赖,基本都会提前对热门影片有了解。这也是微博、淘宝电影、娱乐宝合作的一大优势。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在使用Excel透视表进行数据汇总分析时,我们常遇到“需通过两个字段相乘得到关键指标”的场景——比如“单价×数量=金额”“销量 ...
2025-11-14在测试环境搭建、数据验证等场景中,经常需要将UAT(用户验收测试)环境的表数据同步到SIT(系统集成测试)环境,且两者表结构完 ...
2025-11-14在数据驱动的企业中,常有这样的困境:分析师提交的“万字数据报告”被束之高阁,而一张简洁的“复购率趋势图+核心策略标注”却 ...
2025-11-14在实证研究中,层次回归分析是探究“不同变量组对因变量的增量解释力”的核心方法——通过分步骤引入自变量(如先引入人口统计学 ...
2025-11-13在实时数据分析、实时业务监控等场景中,“数据新鲜度”直接决定业务价值——当电商平台需要实时统计秒杀订单量、金融系统需要实 ...
2025-11-13在数据量爆炸式增长的今天,企业对数据分析的需求已从“有没有”升级为“好不好”——不少团队陷入“数据堆砌却无洞察”“分析结 ...
2025-11-13在主成分分析(PCA)、因子分析等降维方法中,“成分得分系数矩阵” 与 “载荷矩阵” 是两个高频出现但极易混淆的核心矩阵 —— ...
2025-11-12大数据早已不是单纯的技术概念,而是渗透各行业的核心生产力。但同样是拥抱大数据,零售企业的推荐系统、制造企业的设备维护、金 ...
2025-11-12在数据驱动的时代,“数据分析” 已成为企业决策的核心支撑,但很多人对其认知仍停留在 “用 Excel 做报表”“写 SQL 查数据” ...
2025-11-12金融统计不是单纯的 “数据计算”,而是贯穿金融业务全流程的 “风险量化工具”—— 从信贷审批中的客户风险评估,到投资组合的 ...
2025-11-11这个问题很有实战价值,mtcars 数据集是多元线性回归的经典案例,通过它能清晰展现 “多变量影响分析” 的核心逻辑。核心结论是 ...
2025-11-11在数据驱动成为企业核心竞争力的今天,“不知道要什么数据”“分析结果用不上” 是企业的普遍困境 —— 业务部门说 “要提升销量 ...
2025-11-11在大模型(如 Transformer、CNN、多层感知机)的结构设计中,“每层神经元个数” 是决定模型性能与效率的关键参数 —— 个数过少 ...
2025-11-10形成购买决策的四个核心推动力的是:内在需求驱动、产品价值感知、社会环境影响、场景便捷性—— 它们从 “为什么买”“值得买吗 ...
2025-11-10在数字经济时代,“数字化转型” 已从企业的 “可选动作” 变为 “生存必需”。然而,多数企业的转型仍停留在 “上线系统、收集 ...
2025-11-10在数据分析与建模中,“显性特征”(如用户年龄、订单金额、商品类别)是直接可获取的基础数据,但真正驱动业务突破的往往是 “ ...
2025-11-07在大模型(LLM)商业化落地过程中,“结果稳定性” 是比 “单次输出质量” 更关键的指标 —— 对客服对话而言,相同问题需给出一 ...
2025-11-07在数据驱动与合规监管双重压力下,企业数据安全已从 “技术防护” 升级为 “战略刚需”—— 既要应对《个人信息保护法》《数据安 ...
2025-11-07在机器学习领域,“分类模型” 是解决 “类别预测” 问题的核心工具 —— 从 “垃圾邮件识别(是 / 否)” 到 “疾病诊断(良性 ...
2025-11-06在数据分析中,面对 “性别与购物偏好”“年龄段与消费频次”“职业与 APP 使用习惯” 这类成对的分类变量,我们常常需要回答: ...
2025-11-06