
带着一颗敬畏之心,站在大数据时代的中央
当下中国,大数据是个热词。今天的企业、政府,乃至整个社会,很容易通过大数据对市场一目了然,但一目了然之后怎么做?漠视它、改正它、还是适应它?大数据是怎样发挥价值的?
以腾讯近日发布的大数据微报告《95后迷之隐私观大揭秘》为例,走进那些让数据“活”起来的人,或许能找到答案。
大数据给不出解释
一份数据背后,不仅是坐在电脑前,对着数字表格,还会奔波在见调研对象的路上。“大数据给出了结论,但给不了解释。”腾讯用户与市场研究中心总监谭池如是说。
他举了一个多年前参与的手机调研项目为例,通过大数据老外们惊讶地发现中国人偏爱某一种输入法,可是想不通为什么?经过传统调研了解到,由于中国人的抽烟习惯,是一只手拿烟时另一只手只好单手打字,所以用户会偏爱单手型输入法。所以,当这个“为什么”被了解以后,产品的开发才能更多考虑相关模式。
谭池说,“为什么”往往就是大数据的盲点,想要找到答案,还是要依靠面对面的交流询问。就这样,人与人交流的传统模式,不仅没有被掩埋,反而在大数据时代,被一个个数据又激发出来。
大数据读不出场景
大数据提供了一个结果,但它并不知道用户在使用产品时,身处什么样的场景,怀揣怎样的心情,有着怎样的需求,唯有人与人面对面,才能知晓。
腾讯研究员朱丹招募6位盲人为一个无障碍功能设计做访谈准备时,她完全没有想到这群盲人不仅会使用智能手机,而且相当熟练。他们的手机中不断发出“滴”“滴”短促的电子音,常人的耳朵根本听不懂是什么,他们却熟练地使用互联网产品。真切地接触才看得到,原来网络对他们的帮助比我们想象中大很多。
用户真正的使用情景,他们的担忧、开心、困惑与不爽,目前的大数据读不出来。数据再大也是死的,只有人能激活它。
大数据不知道怎么做
大数据本身,并不能给出一个既定做法。面对数据运算的结果,之后的步骤可能更加重要。
研究员韩娜举了一个关于“签到”的例子,究竟95后用户更喜欢哪一种呢?产品经理可能先去找数据师,去调相关的大数据。大数据显示,95后更热衷于每天上网“签到”。但是他们“签到”究竟是出于什么心理,获得了什么满足,数据并不懂。
于是,产品经理接着找韩娜,请她进行用户研究。结果显示,95后乐意“签到”,更多是为了满足自己的情感需求,尤其是“刷存在感”。
时间久了,韩娜渐渐明白,自己做完调研,不能仅仅解答“为什么”,“用户怎么想”,还要给出“怎么做”的建议。
大数据未必懂得价值
罗英、何文是“数据挖掘师”。但这份工作想做得好,单纯依靠算数据并不够,其实还要动用“情商”。
他们举了个例子,QQ音乐有一个功能叫“猜你喜欢”,基于大数据平台。首当其冲的是准确率,能猜对多少首歌?不同的数据师,可能会设计不同的算法,有的人效果比较好,他把“年龄”的数据用起来,而另外一个人没用,就会导致两者准确率有差距。为什么有人能想到“年龄”,而有人却想不到?凭借的更多是对业务的理解。或者说,考验的正是数据师对人性的洞察。
“在我们行内有一个不等式:业务知识>数据>算法。”罗英解释,“而业务知识就是你的理解能力。”用同行的话来说,就是“你的架构是否合理。”
“大数据就好像是一杯水,我们需要去厨房煮菜,水只是素材之一。我们不能直接把水卖给客户,我们需要煮好一碗菜,才能端给客户。”罗英形容。
大数据还能做什么
已经活跃了11年的社交平台QQ空间有着丰富的用户数据,最近腾讯运用这些数据为个人生成一份“社交回顾互动”H5,比如显现出你第一次注册空间的时间,跳出第一张上传的家人合照。“其实也捏了一把汗,这对图片的数据解读要求非常高。”从事QQ空间运营已经11年的琪琪说,“试想,第一张与家人的合影,万一大数据判断错误,跳出来的照片是与男同事的合影,岂不是很尴尬?”怎么抽取数据,让数据判断准确很重要。琪琪认为,利用大数据,我们可以策划许多活动,活动还能变化出各种“玩法”,人的想象力是无穷的。
研究员小迪,做调研时遇到一名初中男孩,对方很有倾诉欲。男孩告诉他,自己有5个QQ号,4个已经被妈妈“破解”了,可能是因为密码太简单,都是生日之类,妈妈太容易猜到。于是他想出了第5个QQ密码,复杂到连自己也记不住。他把密码放在带锁的储钱罐里,每次用这个账号登陆QQ时,他都要先从床底下把密码翻出来才行。
这个故事,后来被小迪写进了《95后谜之隐私观大揭秘》报告中。该报告揭示,95后是一群非常注重隐私的群体,近四成95后认为,自己的隐私遭到过侵犯,他们为了保护隐私采取过各种小手段,他们渴望有自己的空间,活跃于QQ空间其中一个原因就是可以不和父母在同一个社交圈。
我们已经迈入一个大数据的时代。有人说,终究有一天,数据的价值将超过土地的价值。但是也有人说,世界就是一个“黑盒子”,永远无法窥探内部的秘密。
(文中的人名均为化名)
人无法被替代
对话
解放周一:那么您对大数据的未来怎么看?有了人工智能、深度学习,未来人还有用武之地吗?
李航(腾讯集团市场与公关部总经理):目前看待和处理大数据有几种方式。一类是对年龄、性别、星座等基础结构型数据进行呈现和总结。第二类是视频数据、语音数据、图像数据,我们有像优图这样世界领先的技术团队,他们在音频、人脸、图片识别等领域都有深入研究,这也是腾讯的技术优势所在。现在我们正在研究,如何让语音数据与图像数据结合进行分析。第三类就是人工智能,它的想象空间非常大,或许通过深度学习,未来人工智能自己会对数据产生洞察力,理解数据背后的意义、原因、提供建议,一切皆有可能。
未来也许人机之间有新的协作模式,但我相信人无法被替代。人性很复杂,即使人与人的当面交流,所知也是有限的。人的情感、动机、心理,这些都是目前机器解读不了的。
越是与大数据打交道,我越是对人性保有敬畏之心。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
MySQL 执行计划中 rows 数量的准确性解析:原理、影响因素与优化 在 MySQL SQL 调优中,EXPLAIN执行计划是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 对象的 text 与 content:区别、场景与实践指南 在 Python 进行 HTTP 网络请求开发时(如使用requests ...
2025-09-15CDA 数据分析师:激活表格结构数据价值的核心操盘手 表格结构数据(如 Excel 表格、数据库表)是企业最基础、最核心的数据形态 ...
2025-09-15Python HTTP 请求工具对比:urllib.request 与 requests 的核心差异与选择指南 在 Python 处理 HTTP 请求(如接口调用、数据爬取 ...
2025-09-12解决 pd.read_csv 读取长浮点数据的科学计数法问题 为帮助 Python 数据从业者解决pd.read_csv读取长浮点数据时的科学计数法问题 ...
2025-09-12CDA 数据分析师:业务数据分析步骤的落地者与价值优化者 业务数据分析是企业解决日常运营问题、提升执行效率的核心手段,其价值 ...
2025-09-12用 SQL 验证业务逻辑:从规则拆解到数据把关的实战指南 在业务系统落地过程中,“业务逻辑” 是连接 “需求设计” 与 “用户体验 ...
2025-09-11塔吉特百货孕妇营销案例:数据驱动下的精准零售革命与启示 在零售行业 “流量红利见顶” 的当下,精准营销成为企业突围的核心方 ...
2025-09-11CDA 数据分析师与战略 / 业务数据分析:概念辨析与协同价值 在数据驱动决策的体系中,“战略数据分析”“业务数据分析” 是企业 ...
2025-09-11Excel 数据聚类分析:从操作实践到业务价值挖掘 在数据分析场景中,聚类分析作为 “无监督分组” 的核心工具,能从杂乱数据中挖 ...
2025-09-10统计模型的核心目的:从数据解读到决策支撑的价值导向 统计模型作为数据分析的核心工具,并非简单的 “公式堆砌”,而是围绕特定 ...
2025-09-10CDA 数据分析师:商业数据分析实践的落地者与价值创造者 商业数据分析的价值,最终要在 “实践” 中体现 —— 脱离业务场景的分 ...
2025-09-10机器学习解决实际问题的核心关键:从业务到落地的全流程解析 在人工智能技术落地的浪潮中,机器学习作为核心工具,已广泛应用于 ...
2025-09-09SPSS 编码状态区域中 Unicode 的功能与价值解析 在 SPSS(Statistical Product and Service Solutions,统计产品与服务解决方案 ...
2025-09-09CDA 数据分析师:驾驭商业数据分析流程的核心力量 在商业决策从 “经验驱动” 向 “数据驱动” 转型的过程中,商业数据分析总体 ...
2025-09-09R 语言:数据科学与科研领域的核心工具及优势解析 一、引言 在数据驱动决策的时代,无论是科研人员验证实验假设(如前文中的 T ...
2025-09-08T 检验在假设检验中的应用与实践 一、引言 在科研数据分析、医学实验验证、经济指标对比等领域,常常需要判断 “样本间的差异是 ...
2025-09-08在商业竞争日益激烈的当下,“用数据说话” 已从企业的 “加分项” 变为 “生存必需”。然而,零散的数据分析无法持续为业务赋能 ...
2025-09-08随机森林算法的核心特点:原理、优势与应用解析 在机器学习领域,随机森林(Random Forest)作为集成学习(Ensemble Learning) ...
2025-09-05Excel 区域名定义:从基础到进阶的高效应用指南 在 Excel 数据处理中,频繁引用单元格区域(如A2:A100、B3:D20)不仅容易出错, ...
2025-09-05