
大数据最懂你的心_数据分析师
别再问旁人爱你有多深了,估计月亮也代表不了什么。想要得到最权威的答案?不妨试试大数据!
深谙此道的人都能赢得江山和美人,比如美国的奈飞(Netflix)公司,这些年就凭着这个法宝赚得盆满钵满。这家主营电影电视剧的美国公司本来是靠出租DVD影碟赚钱的,在这个网络视频当道的年代,人人都跑去看Youtube了,他们股价大跌,差点倒闭。所幸他们及时明白了“大数据知人心”的道理,搞起了在线视频点播,迅速再次飞黄腾达。
那么,大数据都帮了他们什么呢?借着从亚马逊数据中心租来的服务器,依靠云计算服务,这家视频公司对海量用户信息了如指掌——他们知道哪些人喜欢在星期天晚上用平板电脑看恐怖片,也知道谁会打开视频就直接跳过片头片尾曲,看到哪个演员出场会快进,看到哪一段剧情会重放,有什么评论,会不会分享给朋友,他们甚至知道,看到哪些画面用户会调亮屏幕,增加音量……
这些信息来自这家网站超过3600万名用户的观看资料,他们在每个季度会通过1000多种不同设备收看大约40亿个小时的节目,用户每天在网站上能产生超过3000万个操作行为,而每一个动作,都会被记录成为可供分析的原始资料,帮助网站分析用户,针对不同用户推荐节目。
“我们知道用户的观看习惯,所以我们能够抢在用户提出要求前就提供他们喜爱的内容。”奈飞公司CEO里德·哈斯廷斯说,“我们所要争夺的东西,就是人们的时间。”
不过,他的野心可不止是给你推荐个影片这么简单。奈飞公司根据用户分析,投其所好地翻拍了英国广播公司(BBC)的经典老片《纸牌屋》,因为大数据告诉他们,直到今天,还有许多人点播这部1991年的老剧,而这群观众里不少人喜欢《七宗罪》的导演大卫·芬奇,也大多爱看奥斯卡得主凯文·史派西的电影,就这样,他把这三项热门因素集结在一起,推出了大数据时代的新型电视剧。
果然,《纸牌屋》一上线,就吸引了来自世界各地的点击,就连大洋彼岸的中国网友都乐此不疲地守着电脑。这也难怪,这部剧的播放模式也是数据分析出来的“用户最喜爱观看模式”。午夜12点一到,工程师们一口气把全剧13集都发布到网站上,让人一次看个够,而他们就看着监控系统上激增的在线观看数据,乐呵呵地打开香槟庆祝了。
“我们的目标,就是让美国一些地方的家庭,整整一天都大门不出二门不迈,窝在家里看电视剧。”《纸牌屋》的制片人博·威廉曼颇为得意地对记者说。
有了大数据,看电视这件小事,从此成了一门大学问。奈飞公司专门开设了一个“用户界面管理员”岗位,其中一个头衔叫“10英尺数学家”。因为根据他们的调查,当人们在房间里看视频节目时,电视和沙发的距离大约是10英尺,所以这名工程师每天站在模拟小屋里琢磨,如何让视频节目在屏幕上呈现的状态最好看,能吸引用户目不转睛地看下去。
心思奇绝的地方可不止这些,这家公司还有“2英尺用户界面管理员”,负责琢磨用笔记本电脑看影片的用户心思;另有一个叫“18英寸用户界面管理员”,没错,在平板电脑上怎么看片最舒服,就是他每天的研究课题。
为了更好地琢磨用户的心,公司还搞过一次比赛,老板拿出100万美元做奖金,谁能把影片推荐效率提高10%,谁就能拿走这笔钱。来自世界各地超过5万人参加了比赛,大学教授、计算机专家都寄来了计划书,连掏钱的老板自己都花了一整个圣诞节假期,琢磨着怎么开发一种更准确预测用户喜好的算法。
这个昔日里出租光碟的小公司,如今成了全世界最热门的公司之一。52岁的老板哈斯廷斯一边坐在办公室里吃着饼干,一边跟记者炫耀,那个拿过奥斯卡奖、托尼奖、艾美奖和格莱美奖的喜剧大师梅尔·布鲁克斯,前两天也给他打电话了,87岁的传奇导演在电话那端说:“我不知道你是谁,但他们都跟我说,我应该跟你聊聊。”
不过,哈斯廷斯最近可管不了这么多了。在《纸牌屋》之后,他们又根据大数据分析翻拍了一部电视剧《发展受阻》,本周末就要上线了。他正和工程师们一起忙活,琢磨着从目前收集到的数据信息里,发掘能牢牢拴住观众心的法子。
在哈斯廷斯忙着用大数据拍电视剧的时候,越来越多的领域也开始借大数据的东风了。文学批评,音乐制作,就连奥巴马竞选美国总统,当年都用了奈飞公司提供的分析软件。所以下一次,你不必在KTV里凄凄苦苦地高歌“其实你不懂我的心”了,天涯何处无芳草,人家大数据才最懂你的心。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
机器学习解决实际问题的核心关键:从业务到落地的全流程解析 在人工智能技术落地的浪潮中,机器学习作为核心工具,已广泛应用于 ...
2025-09-09SPSS 编码状态区域中 Unicode 的功能与价值解析 在 SPSS(Statistical Product and Service Solutions,统计产品与服务解决方案 ...
2025-09-09CDA 数据分析师:驾驭商业数据分析流程的核心力量 在商业决策从 “经验驱动” 向 “数据驱动” 转型的过程中,商业数据分析总体 ...
2025-09-09R 语言:数据科学与科研领域的核心工具及优势解析 一、引言 在数据驱动决策的时代,无论是科研人员验证实验假设(如前文中的 T ...
2025-09-08T 检验在假设检验中的应用与实践 一、引言 在科研数据分析、医学实验验证、经济指标对比等领域,常常需要判断 “样本间的差异是 ...
2025-09-08在商业竞争日益激烈的当下,“用数据说话” 已从企业的 “加分项” 变为 “生存必需”。然而,零散的数据分析无法持续为业务赋能 ...
2025-09-08随机森林算法的核心特点:原理、优势与应用解析 在机器学习领域,随机森林(Random Forest)作为集成学习(Ensemble Learning) ...
2025-09-05Excel 区域名定义:从基础到进阶的高效应用指南 在 Excel 数据处理中,频繁引用单元格区域(如A2:A100、B3:D20)不仅容易出错, ...
2025-09-05CDA 数据分析师:以六大分析方法构建数据驱动业务的核心能力 在数据驱动决策成为企业共识的当下,CDA(Certified Data Analyst) ...
2025-09-05SQL 日期截取:从基础方法到业务实战的全维度解析 在数据处理与业务分析中,日期数据是连接 “业务行为” 与 “时间维度” 的核 ...
2025-09-04在卷积神经网络(CNN)的发展历程中,解决 “梯度消失”“特征复用不足”“模型参数冗余” 一直是核心命题。2017 年提出的密集连 ...
2025-09-04CDA 数据分析师:驾驭数据范式,释放数据价值 在数字化转型浪潮席卷全球的当下,数据已成为企业核心生产要素。而 CDA(Certified ...
2025-09-04K-Means 聚类:无监督学习中数据分群的核心算法 在数据分析领域,当我们面对海量无标签数据(如用户行为记录、商品属性数据、图 ...
2025-09-03特征值、特征向量与主成分:数据降维背后的线性代数逻辑 在机器学习、数据分析与信号处理领域,“降维” 是破解高维数据复杂性的 ...
2025-09-03CDA 数据分析师与数据分析:解锁数据价值的关键 在数字经济高速发展的今天,数据已成为企业核心资产与社会发展的重要驱动力。无 ...
2025-09-03解析 loss.backward ():深度学习中梯度汇总与同步的自动触发核心 在深度学习模型训练流程中,loss.backward()是连接 “前向计算 ...
2025-09-02要解答 “画 K-S 图时横轴是等距还是等频” 的问题,需先明确 K-S 图的核心用途(检验样本分布与理论分布的一致性),再结合横轴 ...
2025-09-02CDA 数据分析师:助力企业破解数据需求与数据分析需求难题 在数字化浪潮席卷全球的当下,数据已成为企业核心战略资产。无论是市 ...
2025-09-02Power BI 度量值实战:基于每月收入与税金占比计算累计税金分摊金额 在企业财务分析中,税金分摊是成本核算与利润统计的核心环节 ...
2025-09-01巧用 ALTER TABLE rent ADD INDEX:租房系统数据库性能优化实践 在租房管理系统中,rent表是核心业务表之一,通常存储租赁订单信 ...
2025-09-01