京公网安备 11010802034615号
经营许可证编号:京B2-20210330
在大数据概念下,美国视频网站Netflix豪赌1亿美元制作的连续剧《纸牌屋》迅速走红。这让国内视频网站蠢蠢欲动。
数据的力量能否指导他们自制剧的拍摄?
爱奇艺数据研究院院长葛承志告诉记者,爱奇艺目前正在筹拍三部网络剧,而选择这三个热门的网络小说题材,统统是基于大数据分析。
在此基础上,爱奇艺每天会收集网站上产生的用户行为:包括用户会在哪里暂停、回放、快进等,如果大量观众都在某一个节点做了快进或者回放的动作,爱奇艺就能判断用户喜欢或讨厌的桥段,并以此指导自制剧的生产。
此外,爱奇艺还会搜集用户在网站上的收视行为,根据这些行为将用户进行分类和画像,并据此进行针对性的广告投放。
即便如此,葛承志坦言,网络剧的成功与题材本身、剧本以及精良的制作分不开,不能过度夸大数据所产生的影响力。况且在实际操作中,国内视频网站的主要盈利模式还是广告,用户的付费习惯尚未养成,这就意味着很难完全让用户去决定影视剧的演员、导演、剧本。另一厢,大数据的挖掘、建模和分析门槛,依然很高。
大数据的两个维度
《21世纪》:眼下,大数据是个非常火热的概念。爱奇艺在大数据方面目前有哪些研究与进展?
葛承志:爱奇艺对于大数据的研究主要是两方面。
一是大数据的内容如何为用户服务。对用户来讲,我们的终极目标是让用户看到他想看的,而不必从一堆内容挑选他想看的。我们通过对个人的收视习惯的分析,智能推荐他所感兴趣的内容。
此外,大数据也在为内容生产提供一些帮助,传统影视在制作的时候,更多关注的是大的题材本身和剧本本身的撰写,包括导演、演员的使用。到了互联网的时代,我们甚至可以用其中的一个情节或综艺节目的一个桥段来进行分析,用户对该情节的观看量是高还是低,从而得出用户的喜好,来指导更细的一些操作。
除了用户的纬度,大数据的另一个纬度是如何服务广告主,即帮助广告客户找到适合的受众人群,或找到他的消费者及他的潜在消费者,甚至帮助客户找到他竞争对手的消费者,并对消费者进行营销。比如,通过和百度的合作,我们能够获知观看视频的用户过去都在百度上搜索过哪些内容,从而在次基础上进行广告推送。
《21世纪》:众所周知,Netfilx推出的《纸牌屋》是大数据运用在视频网站上的一个成功典型。那么在自制剧大热的当下,爱奇艺是否也通过大数据分析来指导自制剧的题材?
葛承志:对于《纸牌屋》这部剧,Netflix之所以把它包装成一个大数据成功的典范,核心目的是Netflix需要把自己和传统的影视剧制作公司,如HBO等区别开来。
他需要宣传出自己的特色,这个特色就是互联网大数据的特色。
其实仔细分析一下,这部剧最引人入胜的地方应该还是这个题材本身和剧本。某种程度上,《纸牌屋》的成功是题材和编剧的成功,与大数据、导演、演员等关系不是特别密切,因此,我们应该客观看待《纸牌屋》的成功和大数据在影视创作中所起的作用。
当然,大数据确实能帮助我们来分析什么样的题材是用户关注的,感兴趣的。爱奇艺本身也用大数据来挖掘题材。我们现在已经开机拍摄的三部网络剧,实际上就是基于互联网的数据分析。这三部作品来自国内知名的网络小说,不管线上的阅读还是线下的销量,这三部小说都是关注度非常高的。在这个基础上,我们果断地购买了版权,将其转化为电视剧搬上荧幕。此外,哪些演员具有比较好的口碑,演员和电视剧题材间关联度,都需要我们利用大数据进行分析。
《21世纪》:在影视剧或综艺节目的采购方面,爱奇艺是如何进行数据分析?
葛承志:在影视剧采购方面,我们背后有一套大数据的分析流程。通过对以往类似的题材、类似的编剧、类似的导演、类似的演员所演出的剧,在爱奇艺上的播放量,我们来推测即将采购的电视剧在未来可能产生播放成绩,从而评估这个剧是否值得购买。
很多影视剧在发售的时候,其实还没有拍完,甚至一些比较热门的剧还没有开拍,只有一个剧本的时候就开始卖。作为视频网站,我们肯定要有一个相对准确的分析和预测,从这个角度讲,我们的历史数据能帮很大的忙。
用户画像的价值
《21世纪》:在广告推送方面,你们是怎么样通过数据分析来进行人群的定位和画像的?
葛承志:在广告推送上,我们近两年开发了不少产品。举一个简单例子,如果你最近一个月在百度上搜过宝马汽车,当你来到爱奇艺看任何一个内容的时候,我都知道你曾经搜索过宝马汽车,我就可以给你投放宝马的广告,当然也可以投放奔驰的广告。这就是一搜百映这个产品的核心价值。
我们今年还开发出了一款叫做追星族的产品,众所周知,很多明星都有自己的粉丝群,比如说邓超的粉丝会看邓超相关的广告,也会看邓超的电视剧和电影,甚至可能还会看和邓超相关的综艺节目。当我们捕捉到用户有这样多重收看的行为,我们就会把他定义为邓超的粉丝。紧接着,我们就会向他投放由邓超代言的广告。
总体来说,用户的信息分为两大类,一是用户的自然数据,比如性别、年龄、地区等;另一类是他在互联网上的行为数据,包括他的搜索行为、收视行为等。我们认为用户的行为数据比他的自然数据更加重要。
《21世纪》:那么,爱奇艺目前把用户分为几大类,或是为用户贴了多少种标签呢?
葛承志:标签肯定会有几百个,因为这其中有不同的层面。比如说,我们根据百度的搜索数据,可以给他打上他喜欢不同种类的消费品的标签。比如这个人喜欢汽车,那个人喜欢保健养生,另外一个人喜欢美丽护肤等,这是按照他的兴趣和关注的领域来贴的一种标签,这样的标签可能有几十个,甚至上百个。
另一种标签是关于用户喜欢看何种类型的影视剧。有的用户喜欢枪战类的题材,有的用户喜欢美剧,还有用户喜欢爱情片等等。这个系列的标签可能又有几十个。
除此之外,还有和用户追星相关的标签,比如这个人喜欢邓超,那个人喜欢孙红雷。这些标签被分为不同的维度,每个维度下都有几十个甚至上百个标签。一些用户同时可以贴五六种标签,也就是说,他其实适合五六种不同类型的广告。
《21世纪》:在用户分类的基础上,广告主一般会如何选择受众进行投放呢?
葛承志:通常来说,如果是美容日化、食品饮料等大众消费品行业,广告主不会只挑一类用户,而是会挑好几类标签的用户。但如果你是一个高端品牌,或是针对特定人群的产品品牌,比如你是卖服务器的,那么你的受众对象肯定不是普通老百姓。能够有服务器采购需求的,可能也就那么几万人,几十万人。这时,广告主需要把几类标签叠加,找出重合部分的人,这些用户会很有价值。因此,如何投放广告和品牌所处的行业及他的受众范围有着密切关系。
优酷投奔阿里的大数据视角
《21世纪》:爱奇艺目前的大数据分析方式,你觉得准确率高吗?
葛承志:这个不能一概而论。举个例子,就节目采购而言,通过历史的流量数据来推断国内电视剧的热度,目前的准确率大概可以达到80%以上。这一块数据分析的规律性还是比较强的,因此准确度比较高。
对于一些海外剧,我们更多会看它在海外的播出情况,主要是收视率和它在海外社交媒体上传播的状况。通过海外播出情况能够预测在国内的播出情况,但因为各地区文化不太一样,也有30%的可能会有意外。像我们今年年初播出的《来自星星的你》这部韩剧,它在韩国播出的热度远远没有在国内高。
综艺节目的情况和电视剧还不太一样。由于这些年综艺节目不断推陈出新,热点切换得非常快。前两年火的是歌唱选秀类的节目,去年开始又是亲子类的节目,今年又成了明星真人秀类的节目。这种新的题材更加考验我们对于数据系统的分析,因为这些题材没出现过,没有历史数据积累,分析这方面就有一定难度。我们也会参考类似的节目在海外的播出情况,来进行预测。这方面我们还在不断积累经验。
《21世纪》:你认为,在大数据的挖掘和运用方面,视频网站面临的主要挑战是什么?
葛承志:目前比较大的挑战是,视频网站所能覆盖的用户行为,相对还是在一个有限的范围内。或者说,视频网站主要覆盖的是用户的休闲时光。那么用户在非休闲娱乐的时候,他在工作中、购物中的时候,他的兴趣爱好、消费习惯,作为一个视频网站是无法获取的。
这也是为什么爱奇艺是百度的子公司,而阿里入股了优酷。
你会发现这些视频网站,多多少少和BAT有关。因为从视频网站本身的角度,我们也需要更多层面的用户数据。换言之,大数据的核心目的是描绘用户,我们在描绘一个人的时候你不能只对他的一个方面了解透彻,你必须在各个方面都对他有所了解。这是视频网站在大数据方面的一个挑战,目前大家都在着力去解决这个问题。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数字化商业环境中,数据已成为企业优化运营、抢占市场、规避风险的核心资产。但商业数据分析绝非“堆砌数据、生成报表”的简单 ...
2026-01-20定量报告的核心价值是传递数据洞察,但密密麻麻的表格、复杂的计算公式、晦涩的数值罗列,往往让读者望而却步,导致核心信息被淹 ...
2026-01-20在CDA(Certified Data Analyst)数据分析师的工作场景中,“精准分类与回归预测”是高频核心需求——比如预测用户是否流失、判 ...
2026-01-20在建筑工程造价工作中,清单汇总分类是核心环节之一,尤其是针对楼梯、楼梯间这类包含多个分项工程(如混凝土浇筑、钢筋制作、扶 ...
2026-01-19数据清洗是数据分析的“前置必修课”,其核心目标是剔除无效信息、修正错误数据,让原始数据具备准确性、一致性与可用性。在实际 ...
2026-01-19在CDA(Certified Data Analyst)数据分析师的日常工作中,常面临“无标签高维数据难以归类、群体规律模糊”的痛点——比如海量 ...
2026-01-19在数据仓库与数据分析体系中,维度表与事实表是构建结构化数据模型的核心组件,二者如同“骨架”与“血肉”,协同支撑起各类业务 ...
2026-01-16在游戏行业“存量竞争”的当下,玩家留存率直接决定游戏的生命周期与商业价值。一款游戏即便拥有出色的画面与玩法,若无法精准识 ...
2026-01-16为配合CDA考试中心的 2025 版 CDA Level III 认证新大纲落地,CDA 网校正式推出新大纲更新后的第一套官方模拟题。该模拟题严格遵 ...
2026-01-16在数据驱动决策的时代,数据分析已成为企业运营、产品优化、业务增长的核心工具。但实际工作中,很多数据分析项目看似流程完整, ...
2026-01-15在CDA(Certified Data Analyst)数据分析师的日常工作中,“高维数据处理”是高频痛点——比如用户画像包含“浏览次数、停留时 ...
2026-01-15在教育测量与评价领域,百分制考试成绩的分布规律是评估教学效果、优化命题设计的核心依据,而正态分布则是其中最具代表性的分布 ...
2026-01-15在用户从“接触产品”到“完成核心目标”的全链路中,流失是必然存在的——电商用户可能“浏览商品却未下单”,APP新用户可能“ ...
2026-01-14在产品增长的核心指标体系中,次日留存率是当之无愧的“入门级关键指标”——它直接反映用户对产品的首次体验反馈,是判断产品是 ...
2026-01-14在CDA(Certified Data Analyst)数据分析师的业务实操中,“分类预测”是高频核心需求——比如“预测用户是否会购买商品”“判 ...
2026-01-14在数字化时代,用户的每一次操作——无论是电商平台的“浏览-加购-下单”、APP的“登录-点击-留存”,还是金融产品的“注册-实名 ...
2026-01-13在数据驱动决策的时代,“数据质量决定分析价值”已成为行业共识。数据库、日志系统、第三方平台等渠道采集的原始数据,往往存在 ...
2026-01-13在CDA(Certified Data Analyst)数据分析师的核心能力体系中,“通过数据建立模型、实现预测与归因”是进阶关键——比如“预测 ...
2026-01-13在企业数字化转型过程中,业务模型与数据模型是两大核心支撑体系:业务模型承载“业务应该如何运转”的逻辑,数据模型解决“数据 ...
2026-01-12当前手游市场进入存量竞争时代,“拉新难、留存更难”成为行业普遍痛点。对于手游产品而言,用户留存率不仅直接决定产品的生命周 ...
2026-01-12