京公网安备 11010802034615号
经营许可证编号:京B2-20210330
带着一颗敬畏之心,站在大数据时代的中央
当下中国,大数据是个热词。今天的企业、政府,乃至整个社会,很容易通过大数据对市场一目了然,但一目了然之后怎么做?漠视它、改正它、还是适应它?大数据是怎样发挥价值的?
以腾讯近日发布的大数据微报告《95后迷之隐私观大揭秘》为例,走进那些让数据“活”起来的人,或许能找到答案。
大数据给不出解释
一份数据背后,不仅是坐在电脑前,对着数字表格,还会奔波在见调研对象的路上。“大数据给出了结论,但给不了解释。”腾讯用户与市场研究中心总监谭池如是说。
他举了一个多年前参与的手机调研项目为例,通过大数据老外们惊讶地发现中国人偏爱某一种输入法,可是想不通为什么?经过传统调研了解到,由于中国人的抽烟习惯,是一只手拿烟时另一只手只好单手打字,所以用户会偏爱单手型输入法。所以,当这个“为什么”被了解以后,产品的开发才能更多考虑相关模式。
谭池说,“为什么”往往就是大数据的盲点,想要找到答案,还是要依靠面对面的交流询问。就这样,人与人交流的传统模式,不仅没有被掩埋,反而在大数据时代,被一个个数据又激发出来。
大数据读不出场景
大数据提供了一个结果,但它并不知道用户在使用产品时,身处什么样的场景,怀揣怎样的心情,有着怎样的需求,唯有人与人面对面,才能知晓。
腾讯研究员朱丹招募6位盲人为一个无障碍功能设计做访谈准备时,她完全没有想到这群盲人不仅会使用智能手机,而且相当熟练。他们的手机中不断发出“滴”“滴”短促的电子音,常人的耳朵根本听不懂是什么,他们却熟练地使用互联网产品。真切地接触才看得到,原来网络对他们的帮助比我们想象中大很多。
用户真正的使用情景,他们的担忧、开心、困惑与不爽,目前的大数据读不出来。数据再大也是死的,只有人能激活它。
大数据不知道怎么做
大数据本身,并不能给出一个既定做法。面对数据运算的结果,之后的步骤可能更加重要。
研究员韩娜举了一个关于“签到”的例子,究竟95后用户更喜欢哪一种呢?产品经理可能先去找数据师,去调相关的大数据。大数据显示,95后更热衷于每天上网“签到”。但是他们“签到”究竟是出于什么心理,获得了什么满足,数据并不懂。
于是,产品经理接着找韩娜,请她进行用户研究。结果显示,95后乐意“签到”,更多是为了满足自己的情感需求,尤其是“刷存在感”。
时间久了,韩娜渐渐明白,自己做完调研,不能仅仅解答“为什么”,“用户怎么想”,还要给出“怎么做”的建议。
大数据未必懂得价值
罗英、何文是“数据挖掘师”。但这份工作想做得好,单纯依靠算数据并不够,其实还要动用“情商”。
他们举了个例子,QQ音乐有一个功能叫“猜你喜欢”,基于大数据平台。首当其冲的是准确率,能猜对多少首歌?不同的数据师,可能会设计不同的算法,有的人效果比较好,他把“年龄”的数据用起来,而另外一个人没用,就会导致两者准确率有差距。为什么有人能想到“年龄”,而有人却想不到?凭借的更多是对业务的理解。或者说,考验的正是数据师对人性的洞察。
“在我们行内有一个不等式:业务知识>数据>算法。”罗英解释,“而业务知识就是你的理解能力。”用同行的话来说,就是“你的架构是否合理。”
“大数据就好像是一杯水,我们需要去厨房煮菜,水只是素材之一。我们不能直接把水卖给客户,我们需要煮好一碗菜,才能端给客户。”罗英形容。
大数据还能做什么
已经活跃了11年的社交平台QQ空间有着丰富的用户数据,最近腾讯运用这些数据为个人生成一份“社交回顾互动”H5,比如显现出你第一次注册空间的时间,跳出第一张上传的家人合照。“其实也捏了一把汗,这对图片的数据解读要求非常高。”从事QQ空间运营已经11年的琪琪说,“试想,第一张与家人的合影,万一大数据判断错误,跳出来的照片是与男同事的合影,岂不是很尴尬?”怎么抽取数据,让数据判断准确很重要。琪琪认为,利用大数据,我们可以策划许多活动,活动还能变化出各种“玩法”,人的想象力是无穷的。
研究员小迪,做调研时遇到一名初中男孩,对方很有倾诉欲。男孩告诉他,自己有5个QQ号,4个已经被妈妈“破解”了,可能是因为密码太简单,都是生日之类,妈妈太容易猜到。于是他想出了第5个QQ密码,复杂到连自己也记不住。他把密码放在带锁的储钱罐里,每次用这个账号登陆QQ时,他都要先从床底下把密码翻出来才行。
这个故事,后来被小迪写进了《95后谜之隐私观大揭秘》报告中。该报告揭示,95后是一群非常注重隐私的群体,近四成95后认为,自己的隐私遭到过侵犯,他们为了保护隐私采取过各种小手段,他们渴望有自己的空间,活跃于QQ空间其中一个原因就是可以不和父母在同一个社交圈。
我们已经迈入一个大数据的时代。有人说,终究有一天,数据的价值将超过土地的价值。但是也有人说,世界就是一个“黑盒子”,永远无法窥探内部的秘密。
(文中的人名均为化名)
人无法被替代
对话
解放周一:那么您对大数据的未来怎么看?有了人工智能、深度学习,未来人还有用武之地吗?
李航(腾讯集团市场与公关部总经理):目前看待和处理大数据有几种方式。一类是对年龄、性别、星座等基础结构型数据进行呈现和总结。第二类是视频数据、语音数据、图像数据,我们有像优图这样世界领先的技术团队,他们在音频、人脸、图片识别等领域都有深入研究,这也是腾讯的技术优势所在。现在我们正在研究,如何让语音数据与图像数据结合进行分析。第三类就是人工智能,它的想象空间非常大,或许通过深度学习,未来人工智能自己会对数据产生洞察力,理解数据背后的意义、原因、提供建议,一切皆有可能。
未来也许人机之间有新的协作模式,但我相信人无法被替代。人性很复杂,即使人与人的当面交流,所知也是有限的。人的情感、动机、心理,这些都是目前机器解读不了的。
越是与大数据打交道,我越是对人性保有敬畏之心。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在用户从“接触产品”到“完成核心目标”的全链路中,流失是必然存在的——电商用户可能“浏览商品却未下单”,APP新用户可能“ ...
2026-01-14在产品增长的核心指标体系中,次日留存率是当之无愧的“入门级关键指标”——它直接反映用户对产品的首次体验反馈,是判断产品是 ...
2026-01-14在CDA(Certified Data Analyst)数据分析师的业务实操中,“分类预测”是高频核心需求——比如“预测用户是否会购买商品”“判 ...
2026-01-14在数字化时代,用户的每一次操作——无论是电商平台的“浏览-加购-下单”、APP的“登录-点击-留存”,还是金融产品的“注册-实名 ...
2026-01-13在数据驱动决策的时代,“数据质量决定分析价值”已成为行业共识。数据库、日志系统、第三方平台等渠道采集的原始数据,往往存在 ...
2026-01-13在CDA(Certified Data Analyst)数据分析师的核心能力体系中,“通过数据建立模型、实现预测与归因”是进阶关键——比如“预测 ...
2026-01-13在企业数字化转型过程中,业务模型与数据模型是两大核心支撑体系:业务模型承载“业务应该如何运转”的逻辑,数据模型解决“数据 ...
2026-01-12当前手游市场进入存量竞争时代,“拉新难、留存更难”成为行业普遍痛点。对于手游产品而言,用户留存率不仅直接决定产品的生命周 ...
2026-01-12在CDA(Certified Data Analyst)数据分析师的日常工作中,“挖掘变量间的关联关系”是高频核心需求——比如判断“用户停留时长 ...
2026-01-12在存量竞争时代,用户流失率直接影响企业的营收与市场竞争力。无论是电商、互联网服务还是金融行业,提前精准预测潜在流失用户, ...
2026-01-09在量化投资领域,多因子选股是主流的选股策略之一——其核心逻辑是通过挖掘影响股票未来收益的各类因子(如估值、成长、盈利、流 ...
2026-01-09在CDA(Certified Data Analyst)数据分析师的工作场景中,分类型变量的关联分析是高频需求——例如“用户性别与商品偏好是否相 ...
2026-01-09数据库中的历史数据,是企业运营过程中沉淀的核心资产——包含用户行为轨迹、业务交易记录、产品迭代日志、市场活动效果等多维度 ...
2026-01-08在电商行业竞争日趋激烈的当下,数据已成为驱动业务增长的核心引擎。电商公司的数据分析师,不仅是数据的“解读官”,更是业务的 ...
2026-01-08在数据驱动决策的链路中,统计制图是CDA(Certified Data Analyst)数据分析师将抽象数据转化为直观洞察的关键载体。不同于普通 ...
2026-01-08在主成分分析(PCA)的学习与实践中,“主成分载荷矩阵”和“成分矩阵”是两个高频出现但极易混淆的核心概念。两者均是主成分分 ...
2026-01-07在教学管理、学生成绩分析场景中,成绩分布图是直观呈现成绩分布规律的核心工具——通过图表能快速看出成绩集中区间、高分/低分 ...
2026-01-07在数据分析师的工作闭环中,数据探索与统计分析是连接原始数据与业务洞察的关键环节。CDA(Certified Data Analyst)作为具备专 ...
2026-01-07在数据处理与可视化场景中,将Python分析后的结果导出为Excel文件是高频需求。而通过设置单元格颜色,能让Excel中的数据更具层次 ...
2026-01-06在企业运营、业务监控、数据分析等场景中,指标波动是常态——无论是日营收的突然下滑、用户活跃度的骤升,还是产品故障率的异常 ...
2026-01-06