
企业做大数据需要一个关键人_数据分析师
几年前大数据还不是优酷土豆的文化。管理层、各部门员工,知道有数据,但不知道数据有什么用。数据如何提供决策支撑?如何改变工作效率?没有人知道。其实现在很多公司都面临这个问题,数据是独立的,无法融入公司的运营。
目前,优酷土豆集团的视频总时长已经超过8000年,并且以每天新增4年的速度高速增长。
通过对基于这些内容的数据挖掘,{数据分析师培训}优酷土豆集团可以为用户提供“猜你喜欢”的视频推荐;为广告主提供更精准、有价值的投放内容;给公司版权采购部门提供更清晰的采购指导;让产品部门找到自己的优势并推动页面改版。
除此之外,2014年8月,优酷土豆集团还成立了“合一影业”,希望依托于大数据视频行业的“大自制”时代。
“最重要的,是让数据种子在每个人心中生根发芽,不只是大数据团队,还有管理层、各个部门员工。”优酷土豆集团数据分析高级总监杜长嵘在近日接受21世纪经济报道记者采访时表示,两年前,公司管理层不习惯用数据来做决策,各部门同事也不知道怎么利用数据改善工作,但现在数据文化已经深入人心。
“实现用户、内容、
流量的可视化”
《21世纪》:互联网流量中有50%以上都是视频流量。作为视频公司,优酷土豆如何对视频数据做分析挖掘,这些分析又对你们回馈了哪些价值?
杜长嵘:2014年11月,优酷App 用户时长超过手机QQ,在中文APP中排名第二,仅次于微信。可以说用户在视频上支出的时间越来越多,而视频数据的价值也越来越大。
最典型的大数据应用就是“猜你喜欢”,根据用户个人偏好推荐视频。我们会分析你过去的历史,看用户喜欢哪些类型的视频;寻找跟你同一类型的人,把他们的内容推荐给你;甚至,从视频本身的角度,我们也可以知道看这个视频的人还会喜欢其他哪些内容。融合多个分析维度,就产生了“猜你喜欢”这个应用。
我们对页面浏览、评论、收藏、播放时的拖拽操作进行了记录,并且把分析结果反馈给不同的业务模块。这对包括产品、内容运营、用户的个性化推荐及广告投放、管理层决策支撑,都起到了关键作用。
《21世纪》:视频推荐应该算是改变用户体验的一种应用,那么对于你们的广告主、对于公司管理层,大数据能提供什么价值?
杜长嵘:先举个有意思的案例。双11,我们本来觉得这跟视频没关系。但是,从11.1开始,我们流量开始下滑,11.11当天,流量下滑达到10%,非常严重。我们就赶紧去调查数据,发现天猫在我们这里投放了大量广告,很多优土用户看到购物广告的时候就放弃视频,直接去购物了。也就是说,优酷土豆的视频用户,对于购物网站非常有广告价值。
后来,天猫公布数据,双11期间,天猫的流量来源第一名是淘宝,第二名竟然就是优酷,占了他们流量的30%。我们进一步分析发现:80%的天猫用户是优酷的用户,而庞大的优酷用户中,有50%是天猫用户。他们在我们这边投硬广是一个很正确的决策。
除了用户价值之外,视频内容的价值也可以通过数据衡量,每个内容,都有它匹配的用户群、点击量,老板可以根据这些来衡量、标定每个业务的价值。对广告客户来说,他们能更精确找到自己的用户群。
总的来说,是利用数据实现用户、内容、流量的可视化,价值更透明。管理层需要这些数据,执行更精确的决策。
支撑移动端转型
《21世纪》:对于企业内部的业务管理、流程再造方面,有没有一些明显改变?
杜长嵘:其实,当内容、流量都透明了之后,企业的效率自然就会提升。
拿提升用户体验来说,用户打开视频需要经过几个步骤:打开首页、播放页加载、播放器加载、广告加载、视频加载,然后才是观看。观看过程中还会发生拖拽、卡顿、清晰度切换等等操作。我们每一步骤都会实现数据追踪,包括用户每一个加载完成花了多长时间,出错率或者转换率是多少。如果有问题发生,就可以马上定位是哪一个步骤出现了什么问题。而对应到产品部门,大家都能看清楚是谁的岗位出了问题,相对应的部门也会主动解决。
以前这些过程不透明,很难定位问题、责任,现在效率提升了很多。
《21世纪》:优酷土豆的管理层如何看待大数据,如何利用大数据做决策支撑?
杜长嵘:很多公司讲大数据的时候,都把数据当作是一个应用平台,或者说是一个数据报表的平台,但其实管理层需要的不是这些。他们需要知道的是这些数据的内在价值。这也是我们大数据团队要做的事,让数据说话,告诉管理者过去这段时间都发生了什么。然后讨论,这些变化为什么会发生,从数据上能看出哪些未来的趋势。
对管理层来说,既然看到了趋势到来,那么为什么不干脆去创造趋势、引领趋势呢?
比如,2008年,我们就知道移动端是未来,并开始了部署。2012年1月,我们移动端的流量占比是3%;而2013年1月的时候,移动端流量增长了1400%,占比达到30%;2014年1月,同比仍然增长了250%,占比达到60%,超过PC。到2014年11月,占比已经达到了70%。双11期间,移动端给公司贡献的收入超过40%。
向移动端转型很顺利,主要是因为我们早就把相关的工作部署下去了。
从管理者的决策来说,优酷土豆要做的就是引领趋势、创造趋势。而且,由于有庞大的数据分析支撑,我们能够很谨慎的成为先驱者,不会是先烈。
数据文化要融入公司运营
《21世纪》:你在大数据应用中遇到哪些挑战呢?
杜长嵘:如果你两年前问我这个问题,我可能讲整整一个下午都讲不完。但现在来看,当时遇到的问题都不存在了。
总结来看,几年前大数据还不是优酷土豆的文化。管理层、各部门员工,知道有数据,但不知道数据有什么用。数据如何提供决策支撑?如何改变工作效率?没有人知道。其实现在很多公司都面临这个问题,数据是独立的,无法融入公司的运营。
要发挥大数据的价值,必须要让数据的种子在每个人心中生根发芽。我们现在解决了这些挑战,然后所有的问题就自然而然的消失了。
《21世纪》:这些问题具体是如何解决的?
杜长嵘:我觉得企业做大数据需要一个关键的人,他要带动整个公司的化学变化。这个人其实要懂技术、懂业务,甚至要懂管理、懂运营,你要都懂,然后带头去起推动数据效应,才能让整个公司慢慢产生这个变化。
两年前,只要公司的管理层开会,我就厚着脸皮冲过去。我必须要知道领导在关心什么,然后赶快去投其所好,用数据角度不断的帮他介绍。一次不行,我就讲五次,多讲几次就可以了。现在的优土,数据已经是管理思维的一部分。
不过,对各部门员工来说,推荐大数据比较难,因为很多人觉得数据枯燥,找不到数据的价值所在。以前,不少员工来直接找我们要数据,问他为什么要数据,回答“老板要”、“做工作汇报用”。他们不习惯于用这些数据来改善业务、改变工作。
只能一点点让大家对数据产生兴趣。所以只要一有员工培训会,我就去讲课。一开始还只能讲一些比较好玩的数据分析案例,比如我经常讲一个故事,二次大战时,英国、美国通过对弹痕的分析,来加强飞机的抗击打能力,减少飞机战损。
两年多的潜移默化,其实是让每个人都知道数据的价值在哪里。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
用 SQL 验证业务逻辑:从规则拆解到数据把关的实战指南 在业务系统落地过程中,“业务逻辑” 是连接 “需求设计” 与 “用户体验 ...
2025-09-11塔吉特百货孕妇营销案例:数据驱动下的精准零售革命与启示 在零售行业 “流量红利见顶” 的当下,精准营销成为企业突围的核心方 ...
2025-09-11CDA 数据分析师与战略 / 业务数据分析:概念辨析与协同价值 在数据驱动决策的体系中,“战略数据分析”“业务数据分析” 是企业 ...
2025-09-11Excel 数据聚类分析:从操作实践到业务价值挖掘 在数据分析场景中,聚类分析作为 “无监督分组” 的核心工具,能从杂乱数据中挖 ...
2025-09-10统计模型的核心目的:从数据解读到决策支撑的价值导向 统计模型作为数据分析的核心工具,并非简单的 “公式堆砌”,而是围绕特定 ...
2025-09-10CDA 数据分析师:商业数据分析实践的落地者与价值创造者 商业数据分析的价值,最终要在 “实践” 中体现 —— 脱离业务场景的分 ...
2025-09-10机器学习解决实际问题的核心关键:从业务到落地的全流程解析 在人工智能技术落地的浪潮中,机器学习作为核心工具,已广泛应用于 ...
2025-09-09SPSS 编码状态区域中 Unicode 的功能与价值解析 在 SPSS(Statistical Product and Service Solutions,统计产品与服务解决方案 ...
2025-09-09CDA 数据分析师:驾驭商业数据分析流程的核心力量 在商业决策从 “经验驱动” 向 “数据驱动” 转型的过程中,商业数据分析总体 ...
2025-09-09R 语言:数据科学与科研领域的核心工具及优势解析 一、引言 在数据驱动决策的时代,无论是科研人员验证实验假设(如前文中的 T ...
2025-09-08T 检验在假设检验中的应用与实践 一、引言 在科研数据分析、医学实验验证、经济指标对比等领域,常常需要判断 “样本间的差异是 ...
2025-09-08在商业竞争日益激烈的当下,“用数据说话” 已从企业的 “加分项” 变为 “生存必需”。然而,零散的数据分析无法持续为业务赋能 ...
2025-09-08随机森林算法的核心特点:原理、优势与应用解析 在机器学习领域,随机森林(Random Forest)作为集成学习(Ensemble Learning) ...
2025-09-05Excel 区域名定义:从基础到进阶的高效应用指南 在 Excel 数据处理中,频繁引用单元格区域(如A2:A100、B3:D20)不仅容易出错, ...
2025-09-05CDA 数据分析师:以六大分析方法构建数据驱动业务的核心能力 在数据驱动决策成为企业共识的当下,CDA(Certified Data Analyst) ...
2025-09-05SQL 日期截取:从基础方法到业务实战的全维度解析 在数据处理与业务分析中,日期数据是连接 “业务行为” 与 “时间维度” 的核 ...
2025-09-04在卷积神经网络(CNN)的发展历程中,解决 “梯度消失”“特征复用不足”“模型参数冗余” 一直是核心命题。2017 年提出的密集连 ...
2025-09-04CDA 数据分析师:驾驭数据范式,释放数据价值 在数字化转型浪潮席卷全球的当下,数据已成为企业核心生产要素。而 CDA(Certified ...
2025-09-04K-Means 聚类:无监督学习中数据分群的核心算法 在数据分析领域,当我们面对海量无标签数据(如用户行为记录、商品属性数据、图 ...
2025-09-03特征值、特征向量与主成分:数据降维背后的线性代数逻辑 在机器学习、数据分析与信号处理领域,“降维” 是破解高维数据复杂性的 ...
2025-09-03