京公网安备 11010802034615号
经营许可证编号:京B2-20210330
带着一颗敬畏之心,站在大数据时代的中央
当下中国,大数据是个热词。今天的企业、政府,乃至整个社会,很容易通过大数据对市场一目了然,但一目了然之后怎么做?漠视它、改正它、还是适应它?大数据是怎样发挥价值的?
以腾讯近日发布的大数据微报告《95后迷之隐私观大揭秘》为例,走进那些让数据“活”起来的人,或许能找到答案。
大数据给不出解释
一份数据背后,不仅是坐在电脑前,对着数字表格,还会奔波在见调研对象的路上。“大数据给出了结论,但给不了解释。”腾讯用户与市场研究中心总监谭池如是说。
他举了一个多年前参与的手机调研项目为例,通过大数据老外们惊讶地发现中国人偏爱某一种输入法,可是想不通为什么?经过传统调研了解到,由于中国人的抽烟习惯,是一只手拿烟时另一只手只好单手打字,所以用户会偏爱单手型输入法。所以,当这个“为什么”被了解以后,产品的开发才能更多考虑相关模式。
谭池说,“为什么”往往就是大数据的盲点,想要找到答案,还是要依靠面对面的交流询问。就这样,人与人交流的传统模式,不仅没有被掩埋,反而在大数据时代,被一个个数据又激发出来。
大数据读不出场景
大数据提供了一个结果,但它并不知道用户在使用产品时,身处什么样的场景,怀揣怎样的心情,有着怎样的需求,唯有人与人面对面,才能知晓。
腾讯研究员朱丹招募6位盲人为一个无障碍功能设计做访谈准备时,她完全没有想到这群盲人不仅会使用智能手机,而且相当熟练。他们的手机中不断发出“滴”“滴”短促的电子音,常人的耳朵根本听不懂是什么,他们却熟练地使用互联网产品。真切地接触才看得到,原来网络对他们的帮助比我们想象中大很多。
用户真正的使用情景,他们的担忧、开心、困惑与不爽,目前的大数据读不出来。数据再大也是死的,只有人能激活它。
大数据不知道怎么做
大数据本身,并不能给出一个既定做法。面对数据运算的结果,之后的步骤可能更加重要。
研究员韩娜举了一个关于“签到”的例子,究竟95后用户更喜欢哪一种呢?产品经理可能先去找数据师,去调相关的大数据。大数据显示,95后更热衷于每天上网“签到”。但是他们“签到”究竟是出于什么心理,获得了什么满足,数据并不懂。
于是,产品经理接着找韩娜,请她进行用户研究。结果显示,95后乐意“签到”,更多是为了满足自己的情感需求,尤其是“刷存在感”。
时间久了,韩娜渐渐明白,自己做完调研,不能仅仅解答“为什么”,“用户怎么想”,还要给出“怎么做”的建议。
大数据未必懂得价值
罗英、何文是“数据挖掘师”。但这份工作想做得好,单纯依靠算数据并不够,其实还要动用“情商”。
他们举了个例子,QQ音乐有一个功能叫“猜你喜欢”,基于大数据平台。首当其冲的是准确率,能猜对多少首歌?不同的数据师,可能会设计不同的算法,有的人效果比较好,他把“年龄”的数据用起来,而另外一个人没用,就会导致两者准确率有差距。为什么有人能想到“年龄”,而有人却想不到?凭借的更多是对业务的理解。或者说,考验的正是数据师对人性的洞察。
“在我们行内有一个不等式:业务知识>数据>算法。”罗英解释,“而业务知识就是你的理解能力。”用同行的话来说,就是“你的架构是否合理。”
“大数据就好像是一杯水,我们需要去厨房煮菜,水只是素材之一。我们不能直接把水卖给客户,我们需要煮好一碗菜,才能端给客户。”罗英形容。
大数据还能做什么
已经活跃了11年的社交平台QQ空间有着丰富的用户数据,最近腾讯运用这些数据为个人生成一份“社交回顾互动”H5,比如显现出你第一次注册空间的时间,跳出第一张上传的家人合照。“其实也捏了一把汗,这对图片的数据解读要求非常高。”从事QQ空间运营已经11年的琪琪说,“试想,第一张与家人的合影,万一大数据判断错误,跳出来的照片是与男同事的合影,岂不是很尴尬?”怎么抽取数据,让数据判断准确很重要。琪琪认为,利用大数据,我们可以策划许多活动,活动还能变化出各种“玩法”,人的想象力是无穷的。
研究员小迪,做调研时遇到一名初中男孩,对方很有倾诉欲。男孩告诉他,自己有5个QQ号,4个已经被妈妈“破解”了,可能是因为密码太简单,都是生日之类,妈妈太容易猜到。于是他想出了第5个QQ密码,复杂到连自己也记不住。他把密码放在带锁的储钱罐里,每次用这个账号登陆QQ时,他都要先从床底下把密码翻出来才行。
这个故事,后来被小迪写进了《95后谜之隐私观大揭秘》报告中。该报告揭示,95后是一群非常注重隐私的群体,近四成95后认为,自己的隐私遭到过侵犯,他们为了保护隐私采取过各种小手段,他们渴望有自己的空间,活跃于QQ空间其中一个原因就是可以不和父母在同一个社交圈。
我们已经迈入一个大数据的时代。有人说,终究有一天,数据的价值将超过土地的价值。但是也有人说,世界就是一个“黑盒子”,永远无法窥探内部的秘密。
(文中的人名均为化名)
人无法被替代
对话
解放周一:那么您对大数据的未来怎么看?有了人工智能、深度学习,未来人还有用武之地吗?
李航(腾讯集团市场与公关部总经理):目前看待和处理大数据有几种方式。一类是对年龄、性别、星座等基础结构型数据进行呈现和总结。第二类是视频数据、语音数据、图像数据,我们有像优图这样世界领先的技术团队,他们在音频、人脸、图片识别等领域都有深入研究,这也是腾讯的技术优势所在。现在我们正在研究,如何让语音数据与图像数据结合进行分析。第三类就是人工智能,它的想象空间非常大,或许通过深度学习,未来人工智能自己会对数据产生洞察力,理解数据背后的意义、原因、提供建议,一切皆有可能。
未来也许人机之间有新的协作模式,但我相信人无法被替代。人性很复杂,即使人与人的当面交流,所知也是有限的。人的情感、动机、心理,这些都是目前机器解读不了的。
越是与大数据打交道,我越是对人性保有敬畏之心。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数据处理的全流程中,数据呈现与数据分析是两个紧密关联却截然不同的核心环节。无论是科研数据整理、企业业务复盘,还是日常数 ...
2026-03-06在数据分析、数据预处理场景中,dat文件是一种常见的二进制或文本格式数据文件,广泛应用于科研数据、工程数据、传感器数据等领 ...
2026-03-06在数据驱动决策的时代,CDA(Certified Data Analyst)数据分析师的核心价值,早已超越单纯的数据清洗与统计分析,而是通过数据 ...
2026-03-06在教学管理、培训数据统计、课程体系搭建等场景中,经常需要对课时数据进行排序并实现累加计算——比如,按课程章节排序,累加各 ...
2026-03-05在数据分析场景中,环比是衡量数据短期波动的核心指标——它通过对比“当前周期与上一个相邻周期”的数据,直观反映指标的月度、 ...
2026-03-05数据治理是数字化时代企业实现数据价值最大化的核心前提,而CDA(Certified Data Analyst)数据分析师作为数据全生命周期的核心 ...
2026-03-05在实验检测、质量控制、科研验证等场景中,“方法验证”是确保检测/分析结果可靠、可复用的核心环节——无论是新开发的检测方法 ...
2026-03-04在数据分析、科研实验、办公统计等场景中,我们常常需要对比两组数据的整体差异——比如两种营销策略的销售额差异、两种实验方案 ...
2026-03-04在数字化转型进入深水区的今天,企业对数据的依赖程度日益加深,而数据治理体系则是企业实现数据规范化、高质量化、价值化的核心 ...
2026-03-04在深度学习,尤其是卷积神经网络(CNN)的实操中,转置卷积(Transposed Convolution)是一个高频应用的操作——它核心用于实现 ...
2026-03-03在日常办公、数据分析、金融理财、科研统计等场景中,我们经常需要计算“平均值”来概括一组数据的整体水平——比如计算月度平均 ...
2026-03-03在数字化转型的浪潮中,数据已成为企业最核心的战略资产,而数据治理则是激活这份资产价值的前提——没有规范、高质量的数据治理 ...
2026-03-03在Excel办公中,数据透视表是汇总、分析繁杂数据的核心工具,我们常常通过它快速得到销售额汇总、人员统计、业绩分析等关键结果 ...
2026-03-02在日常办公和数据分析中,我们常常需要探究两个或多个数据之间的关联关系——比如销售额与广告投入是否正相关、员工出勤率与绩效 ...
2026-03-02在数字化运营中,时间序列数据是CDA(Certified Data Analyst)数据分析师最常接触的数据类型之一——每日的营收、每小时的用户 ...
2026-03-02在日常办公中,数据透视表是Excel、WPS等表格工具中最常用的数据分析利器——它能快速汇总繁杂数据、挖掘数据关联、生成直观报表 ...
2026-02-28有限元法(Finite Element Method, FEM)作为工程数值模拟的核心工具,已广泛应用于机械制造、航空航天、土木工程、生物医学等多 ...
2026-02-28在数字化时代,“以用户为中心”已成为企业运营的核心逻辑,而用户画像则是企业读懂用户、精准服务用户的关键载体。CDA(Certifi ...
2026-02-28在Python面向对象编程(OOP)中,类方法是构建模块化、可复用代码的核心载体,也是实现封装、继承、多态特性的关键工具。无论是 ...
2026-02-27在MySQL数据库优化中,索引是提升查询效率的核心手段—— 面对千万级、亿级数据量,合理创建索引能将查询时间从秒级压缩到毫秒级 ...
2026-02-27