京公网安备 11010802034615号
经营许可证编号:京B2-20210330
带着一颗敬畏之心,站在大数据时代的中央
当下中国,大数据是个热词。今天的企业、政府,乃至整个社会,很容易通过大数据对市场一目了然,但一目了然之后怎么做?漠视它、改正它、还是适应它?大数据是怎样发挥价值的?
以腾讯近日发布的大数据微报告《95后迷之隐私观大揭秘》为例,走进那些让数据“活”起来的人,或许能找到答案。
大数据给不出解释
一份数据背后,不仅是坐在电脑前,对着数字表格,还会奔波在见调研对象的路上。“大数据给出了结论,但给不了解释。”腾讯用户与市场研究中心总监谭池如是说。
他举了一个多年前参与的手机调研项目为例,通过大数据老外们惊讶地发现中国人偏爱某一种输入法,可是想不通为什么?经过传统调研了解到,由于中国人的抽烟习惯,是一只手拿烟时另一只手只好单手打字,所以用户会偏爱单手型输入法。所以,当这个“为什么”被了解以后,产品的开发才能更多考虑相关模式。
谭池说,“为什么”往往就是大数据的盲点,想要找到答案,还是要依靠面对面的交流询问。就这样,人与人交流的传统模式,不仅没有被掩埋,反而在大数据时代,被一个个数据又激发出来。
大数据读不出场景
大数据提供了一个结果,但它并不知道用户在使用产品时,身处什么样的场景,怀揣怎样的心情,有着怎样的需求,唯有人与人面对面,才能知晓。
腾讯研究员朱丹招募6位盲人为一个无障碍功能设计做访谈准备时,她完全没有想到这群盲人不仅会使用智能手机,而且相当熟练。他们的手机中不断发出“滴”“滴”短促的电子音,常人的耳朵根本听不懂是什么,他们却熟练地使用互联网产品。真切地接触才看得到,原来网络对他们的帮助比我们想象中大很多。
用户真正的使用情景,他们的担忧、开心、困惑与不爽,目前的大数据读不出来。数据再大也是死的,只有人能激活它。
大数据不知道怎么做
大数据本身,并不能给出一个既定做法。面对数据运算的结果,之后的步骤可能更加重要。
研究员韩娜举了一个关于“签到”的例子,究竟95后用户更喜欢哪一种呢?产品经理可能先去找数据师,去调相关的大数据。大数据显示,95后更热衷于每天上网“签到”。但是他们“签到”究竟是出于什么心理,获得了什么满足,数据并不懂。
于是,产品经理接着找韩娜,请她进行用户研究。结果显示,95后乐意“签到”,更多是为了满足自己的情感需求,尤其是“刷存在感”。
时间久了,韩娜渐渐明白,自己做完调研,不能仅仅解答“为什么”,“用户怎么想”,还要给出“怎么做”的建议。
大数据未必懂得价值
罗英、何文是“数据挖掘师”。但这份工作想做得好,单纯依靠算数据并不够,其实还要动用“情商”。
他们举了个例子,QQ音乐有一个功能叫“猜你喜欢”,基于大数据平台。首当其冲的是准确率,能猜对多少首歌?不同的数据师,可能会设计不同的算法,有的人效果比较好,他把“年龄”的数据用起来,而另外一个人没用,就会导致两者准确率有差距。为什么有人能想到“年龄”,而有人却想不到?凭借的更多是对业务的理解。或者说,考验的正是数据师对人性的洞察。
“在我们行内有一个不等式:业务知识>数据>算法。”罗英解释,“而业务知识就是你的理解能力。”用同行的话来说,就是“你的架构是否合理。”
“大数据就好像是一杯水,我们需要去厨房煮菜,水只是素材之一。我们不能直接把水卖给客户,我们需要煮好一碗菜,才能端给客户。”罗英形容。
大数据还能做什么
已经活跃了11年的社交平台QQ空间有着丰富的用户数据,最近腾讯运用这些数据为个人生成一份“社交回顾互动”H5,比如显现出你第一次注册空间的时间,跳出第一张上传的家人合照。“其实也捏了一把汗,这对图片的数据解读要求非常高。”从事QQ空间运营已经11年的琪琪说,“试想,第一张与家人的合影,万一大数据判断错误,跳出来的照片是与男同事的合影,岂不是很尴尬?”怎么抽取数据,让数据判断准确很重要。琪琪认为,利用大数据,我们可以策划许多活动,活动还能变化出各种“玩法”,人的想象力是无穷的。
研究员小迪,做调研时遇到一名初中男孩,对方很有倾诉欲。男孩告诉他,自己有5个QQ号,4个已经被妈妈“破解”了,可能是因为密码太简单,都是生日之类,妈妈太容易猜到。于是他想出了第5个QQ密码,复杂到连自己也记不住。他把密码放在带锁的储钱罐里,每次用这个账号登陆QQ时,他都要先从床底下把密码翻出来才行。
这个故事,后来被小迪写进了《95后谜之隐私观大揭秘》报告中。该报告揭示,95后是一群非常注重隐私的群体,近四成95后认为,自己的隐私遭到过侵犯,他们为了保护隐私采取过各种小手段,他们渴望有自己的空间,活跃于QQ空间其中一个原因就是可以不和父母在同一个社交圈。
我们已经迈入一个大数据的时代。有人说,终究有一天,数据的价值将超过土地的价值。但是也有人说,世界就是一个“黑盒子”,永远无法窥探内部的秘密。
(文中的人名均为化名)
人无法被替代
对话
解放周一:那么您对大数据的未来怎么看?有了人工智能、深度学习,未来人还有用武之地吗?
李航(腾讯集团市场与公关部总经理):目前看待和处理大数据有几种方式。一类是对年龄、性别、星座等基础结构型数据进行呈现和总结。第二类是视频数据、语音数据、图像数据,我们有像优图这样世界领先的技术团队,他们在音频、人脸、图片识别等领域都有深入研究,这也是腾讯的技术优势所在。现在我们正在研究,如何让语音数据与图像数据结合进行分析。第三类就是人工智能,它的想象空间非常大,或许通过深度学习,未来人工智能自己会对数据产生洞察力,理解数据背后的意义、原因、提供建议,一切皆有可能。
未来也许人机之间有新的协作模式,但我相信人无法被替代。人性很复杂,即使人与人的当面交流,所知也是有限的。人的情感、动机、心理,这些都是目前机器解读不了的。
越是与大数据打交道,我越是对人性保有敬畏之心。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
【核心关键词】贷款、报表、课程、专业、建模、缺失值、营销、互联网、银行、办公自动化、数据分析、数据预处理、特征工程、贷 ...
2026-06-05在数据库数据查询、业务报表统计、多表关联分析中,LEFT JOIN左连接是使用率最高的SQL关联查询语句。其核心特性是保留左表全部数 ...
2026-06-05 很多数据分析师能熟练地写SQL、做透视表、算描述性统计,但当被问到“如何预测用户流失概率”“如何归因销量下滑的关键因素 ...
2026-06-05任何一款产品从诞生、普及到最终退出市场,都会遵循一套固定的发展规律,这就是产品生命周期理论。在市场竞争日益激烈、产品迭代 ...
2026-06-04在Excel数据分析、办公统计、业务报表制作场景中,数据透视表是数据汇总、分类统计、快速复盘的核心工具,能够高效完成海量原始 ...
2026-06-04 很多数据分析师拿到数据就开始清洗、建模,但当被问到“这批数据属于什么类型——结构化还是非结构化?分类变量还是数值变量 ...
2026-06-04在问卷调查与社会科学数据分析中,卡方检验是最常用、最基础的非参数检验方法,广泛应用于市场调研、用户分析、行为统计、满意度 ...
2026-06-03【核心关键词】贷款、报表、课程、专业、建模、缺失值、营销、互联网、银行、办公自动化、数据分析、数据预处理、特征工程、贷 ...
2026-06-03 很多数据分析师画过趋势图、做过业绩预测,但当被问到“这个月销售额增长20%,到底是长期趋势自然增长,还是促销活动的短期 ...
2026-06-03逻辑回归是数据分析、机器学习、统计建模中应用最广泛的二分类预测模型,常用于风险判断、行为预测、归因分析等场景。在SPSS、Py ...
2026-06-02数字经济时代,市场竞争日趋同质化,用户消费需求愈发个性化、多元化,传统依托经验、粗放式、广撒网的营销模式弊端日益凸显。长 ...
2026-06-02 很多数据分析师做过按月份的销售额趋势图,画过按天的流量折线图,但当被问到“时间序列和普通数据有什么本质区别”“季节性 ...
2026-06-02在市场竞争日趋饱和、用户需求不断细分的当下,企业创业创新、产品迭代与市场拓展不再依赖经验决策,而是需要系统化、工具化的商 ...
2026-06-01【核心关键词】调度、岗位、数据库、企业、报表、培训、程序、数据分析、数据加工、业务部门、企业数据、调度工具、业务指标、 ...
2026-06-01 很多数据分析师能熟练地计算指标、搭建标签体系,但当被问到“画像到底在解决什么问题”“画像和标签是什么关系”“画像如何 ...
2026-06-01在数据统计分析、数据清洗、异常值识别与数据分布研究中,箱型图是最直观、高效、专业的可视化分析工具。相较于柱状图、折线图仅 ...
2026-05-29Tkinter是Python内置的标准GUI图形界面库,具备无需额外安装、调用简单、兼容性强、轻量化高效等优势,是Python快速开发桌面小程 ...
2026-05-29 很多分析师在设计标签时思路清晰,但真到落地环节却面临“数据在手,不知如何转化为可用标签”的困境:或因加工方式选择不当 ...
2026-05-29【核心关键词】大数据、经理、专业、金融、客户、传统、建模、数据产品、互联网金融、产品经理、数据分析、金融行业、数据模型 ...
2026-05-28 很多分析师每天和数据打交道,但当被问到“标签是什么”“标签和指标有什么区别”“标签体系如何设计”时,却常常答不上来。 ...
2026-05-28