京公网安备 11010802034615号
经营许可证编号:京B2-20210330
2014 年《纸牌屋》第二季开播,这部因口碑传播而声名鹊起的电视剧并非出自传统电视台,而是由美国在线影片租赁提供商奈飞( Netflix) 公司预付1 亿美元制作的,《纸牌屋》两季共26 集,平均每集的制作经费是美剧平均制作费用的两倍。
据说在推向市场后,出于喜欢热闹的看客心理,《纸牌屋》效应正在呈现涟漪状态。这部描述华盛顿DC的政治全景的网络自制剧,已在评论界和美剧迷中收获了不俗的口碑。据说,从奥巴马到王岐山,再到很多数得上名字的经济学家与公众人物,都在不无骄傲地表明自己是《纸牌屋》的粉丝,这一点让人感觉,没看过就out了。
有人认为《纸牌屋》的成功基于大数据的应用,毕竟这个美剧是通过对3000万用户的收视选择,400万条评论,300万主题搜索进行分析,确定受众对拍摄主题、拍摄导演、参演演员、播出方式的喜好,而爆红全球,震惊了全球的秘密武器是基于数据的严谨性。
通过数据分析与市场推广,将一部电视剧的策划制作,变成了跨界营销的划时代经典案例,这确实有可圈可点之处,虽然并非每个人都能看清《纸牌屋》成功的基因,以及到底会形成什么样的影响力,但贾春宝还是希望从理性的角度谈谈自己的分析。
在技术学派认为,媒体连篇累牍的是《纸牌屋》基于大数据,有一套人人艳羡的成功公式,将纯粹基于技术的大数据,而通过市场直接转化为摇钱树,
市场认为,作为北美最大的付费订阅视频网站,出品方奈飞分析了用户的每一个动作,包括什么时候快进,什么时候回放等,找出一些明显的特征,接下来就是根据数据,通过分析统计这些剧集的暂停、回放、快进、停止、搜索、分享、收藏、评论等多维度数据,然后回头去看相应的剧作内容,看看在哪一集的哪个桥段,以及是什么剧情最有吸引力。
最后,就来到了最重要的分析阶段,得出政治剧观众的口味:喜欢什么悬念(配角生死未明/法案是否通过/表白是否被接受)、喜欢什么话题(政治游戏规则/男女主角的爱情/和现实世界相互呼应的程度)、喜欢什么场面(打斗/谈判/性暗示)等等。总结出一套规律,并运用到《纸牌屋》的制作当中。
技术人员认为,大数据可以预测一场流感爆发的时间和地点,可以预测什么时候可以买到最便宜的飞机票,可以预测消费者会给怎样的电视剧好评。大数据的预测是小数据不具备的功能,但是小数据的深度分析也是大数据不具备的。
谷歌公司数据处理量是美国国家图书馆所有纸质所含数据的上千倍。Facebook 每天更新的照片量超过1000 万张,每天人们在网站上点like 的按钮或评论超过三十亿次,这些都为Facebook 公司挖掘用户喜好提供了大量的数据线索。
量变导致质变,数据庞大到一定程度,就不仅仅是数据以及简单的结论那么简单。对大数据掌握程度可以转化为经济价值来源。同时,大数据已经撼动了世界方方面面。从科技到医疗、政治、经济、人文,以及社会的其他领域。我们不能否认数据与市场调查在企业决策中所起到的作用越来越重要了。
但实际上,大数据之于《纸牌屋》虽然有功,所发挥的却并不是至关重要的作用。有理性的业内人士断言:宣传大数据分析的噱头,就是奈飞的企业PR 行为。此举是为了在传统电视界争得话语权,为了打压亚马逊即将开始的原创剧集拍摄。优酷CEO古永锵认为,《纸牌屋》实际上还是靠SONY的制作功底,大数据有用,但不能神化。
贾春宝的观点是:不要迷信大数据,而要基于“傻子都看得出来”的常识。以大数据为依托,固然会让自己更真切地把握市场的脉搏,但也会让我们在投其所好的同时,失去自我。大数据的趋势下,貌似市场的未来更确定了,其实刚好相反——变得更不确定了,或者是在让自己陷入迷茫这一点上,是更确定了!
我们总希望去预测未来,即使我们知道我们必然要往生,都不知道是在什么时候,基于什么外力或者内因,在那一刻我们是否已经了无遗憾。
因为数据有可能是假的,有可能是根据内心的需求而炮制出来的。即使数据都是真实的,那么对数据的影响性因素太多了,人冒然得出的结论也会导致不确定的结果。
迷信市场调查与分析的人,会信誓旦旦地跟你讲,TA所设计的问卷有多么地科学,符合人的心理,有效规避人之撒谎以及情绪波动所带来的影响,甚至即使撒谎都会被查出来,并将那些无效数据剔除,而给你提供的都是干货。
但至少你需要有专业团队去设计问卷,然后有专业团队去实施调查,所调查并被采用的数据均出自负责任的信息反馈,而且所涉及的被调查者基本都很配合(乖乖的把真实想法告诉你)还需要在数据统计的时候有严谨而精细的设备与方法,进行数据分析的人既要尊重数据还要不迷信数据,并从数据之中跳出来, ——那么我要问“凭什么”。
即使关于调查的一切顾虑都解决了,一路绿灯,那么你又何以保证未来不至于发生环境与时机的变化呢?——因此,依靠数据进行的决策,其迷茫往往是连环并逐步深入,而且难以彻底消除的。
在天时地利人和、政策市场与人的期待等等各方面有任何一点变化,都将导致你所深信不疑的决策模式发生常识性的错误,因为你犯了早已在中国成语故事中被嘲笑的低级错误——刻舟求剑!即使你给自己披上了严谨而炫目的外衣,都难以掩盖你的too young, too naive的本质。
在科技发展到一定阶段的时刻,大数据的预测率可能达到90%甚至100%,人类真正拥有了预测未来的本领,这会不会是一场灾难。无论我们干什么说什么,其实早就按照指定的轨迹运转,这会不会成为一把双刃剑,我们无从得知!
最后,随着大数据的普及使用,我们会不会生活在一个由冰冷数据包裹的世界,我们的意志和行为都被智能机器操纵,人类的创造性可能被空前遏制,社会不再进步。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在 MySQL 实际应用中,“频繁写入同一表” 是常见场景 —— 如实时日志存储(用户操作日志、系统运行日志)、高频交易记录(支付 ...
2025-10-30为帮助教育工作者、研究者科学分析 “班级规模” 与 “平均成绩” 的关联关系,我将从相关系数的核心定义与类型切入,详解 “数 ...
2025-10-30对 CDA(Certified Data Analyst)数据分析师而言,“相关系数” 不是简单的数字计算,而是 “从业务问题出发,量化变量间关联强 ...
2025-10-30在构建前向神经网络(Feedforward Neural Network,简称 FNN)时,“隐藏层数目设多少?每个隐藏层该放多少个神经元?” 是每个 ...
2025-10-29这个问题切中了 Excel 用户的常见困惑 —— 将 “数据可视化工具” 与 “数据挖掘算法” 的功能边界混淆。核心结论是:Excel 透 ...
2025-10-29在 CDA(Certified Data Analyst)数据分析师的工作中,“多组数据差异验证” 是高频需求 —— 例如 “3 家门店的销售额是否有显 ...
2025-10-29在数据分析中,“正态分布” 是许多统计方法(如 t 检验、方差分析、线性回归)的核心假设 —— 数据符合正态分布时,统计检验的 ...
2025-10-28箱线图(Box Plot)作为展示数据分布的核心统计图表,能直观呈现数据的中位数、四分位数、离散程度与异常值,是质量控制、实验分 ...
2025-10-28在 CDA(Certified Data Analyst)数据分析师的工作中,“分类变量关联分析” 是高频需求 —— 例如 “用户性别是否影响支付方式 ...
2025-10-28在数据可视化领域,单一图表往往难以承载多维度信息 —— 力导向图擅长展现节点间的关联结构与空间分布,却无法直观呈现 “流量 ...
2025-10-27这个问题问到了 Tableau 中两个核心行级函数的经典组合,理解它能帮你快速实现 “相对位置占比” 的分析需求。“index ()/size ( ...
2025-10-27对 CDA(Certified Data Analyst)数据分析师而言,“假设检验” 绝非 “套用统计公式的机械操作”,而是 “将模糊的业务猜想转 ...
2025-10-27在数字化运营中,“凭感觉做决策” 早已成为过去式 —— 运营指标作为业务增长的 “晴雨表” 与 “导航仪”,直接决定了运营动作 ...
2025-10-24在卷积神经网络(CNN)的训练中,“卷积层(Conv)后是否添加归一化(如 BN、LN)和激活函数(如 ReLU、GELU)” 是每个开发者都 ...
2025-10-24在数据决策链条中,“统计分析” 是挖掘数据规律的核心,“可视化” 是呈现规律的桥梁 ——CDA(Certified Data Analyst)数据分 ...
2025-10-24在 “神经网络与卡尔曼滤波融合” 的理论基础上,Python 凭借其丰富的科学计算库(NumPy、FilterPy)、深度学习框架(PyTorch、T ...
2025-10-23在工业控制、自动驾驶、机器人导航、气象预测等领域,“状态估计” 是核心任务 —— 即从含噪声的观测数据中,精准推断系统的真 ...
2025-10-23在数据分析全流程中,“数据清洗” 恰似烹饪前的食材处理:若食材(数据)腐烂变质、混杂异物(脏数据),即便拥有精湛的烹饪技 ...
2025-10-23在人工智能领域,“大模型” 已成为近年来的热点标签:从参数超 1750 亿的 GPT-3,到万亿级参数的 PaLM,再到多模态大模型 GPT-4 ...
2025-10-22在 MySQL 数据库的日常运维与开发中,“更新数据是否会影响读数据” 是一个高频疑问。这个问题的答案并非简单的 “是” 或 “否 ...
2025-10-22