
我们在生活或工作中会碰到以下情景:公司的女神安娜一直喜欢吃哈根达斯冰激凌,几乎每天要买一杯,但某一天,她却拿着一个DQ冰雪皇后品尝得津津有味;公司屌丝程序员李甲上班早,加班多,完成任务代码质量高,公司团建活动也积极参与,连续多个季度是公司的优秀员工,突然某一天,态度坚决提出离职,说要回家支教。
我让从事大数据服务的朋友来预测和解释,朋友讲,如果按大数据基本算法推测,女神安娜是不会吃DQ的,因为她的行为数据已经表明,她会继续吃哈根达斯;同样,行为大数据分析得出,程序猿李甲很快会晋升为研发经理或总监,而无法预测某天他要回乡支教。那么问题来了,基于受众行为大数据建立应用模型能取代实时的心理反馈数据吗?两者如何结合?
事实上,做数据有两个概念:一个是大数据,一个是快数据。比如,我们双11在天猫或京东上购物,我们在这些网站的所有行为:浏览网页、对比商品、下订单、付款、评价商品等等,构成了一幅大数据画面,而所有天猫上的用户的大数据画面即组成了大数据组合。天猫可以根据大数据组合分析哪个省的女神罩杯大,预测哪些商品会畅销;也可以根据一个人的行为轨迹大数据建立模型来预测她可能对什么商品感兴趣,进行广告的定向投放。当这个用户不去点击这样的广告或者这个用户离开天猫,一个月后才再次上天猫时,我们无法从行为大数据去找到相关性或者原因。这个时候,快数据出现了,对于未点击广告或者离开天猫一个月才来的用户,商家一般通过问卷反馈表的方式,收集用户当时的想法,基于这个问卷反馈表的数据,他们即可以实时知晓用户心理反馈,并采取对应措施。
问卷能帮助反馈用户心理,打造“快数据”效果。如全球500强公司强生用问卷的方式收集员工想法,并结合员工的日常表现进行评估打分;初创公司V电影用问卷表的方式收集制作人的需求,快速的进行产品迭代;乐视TV用表单进行售后服务意见的收集和管理;小米公司通过快数据进行智能硬件试用…
为什么快数据能在很多场景上得到应用?不论是大数据还是快数据,其实我们在应用和解读时,都不能离开对“人性”的理解,对于“人性”的理解,才是我们建立数据解读模型的关键。而恰恰在这一点,实时反馈互动的快数据更加能在数据中体现对“人性”的理解。
大数据和快数据可以非常好地形成互补关系,相互映射,相得益彰。比如,在美国,当你访问著名购物网站亚马逊时,一方面它基于你的浏览行为大数据推荐图书;一方面在你离开网站时会给你一份3-5个题目的反馈表,了解你的心理活动;两者结合起来,第二天你可能就会收到它的小礼品邮件或者促销邮件。据前亚马逊数据科学家分析,这样的大数据和快数据互动模型的建立,让亚马逊的满意度提高了1.5个百分点。
快数据会不会成为继大数据后的一个新热点?事实上,企业、传媒机构、政府、高校等社会组织是最大的客户。这些用户对于大数据有需求,同样对于基于实时反馈互动的快数据需求非常旺盛。在美国,基于问卷调查的快数据公司Surveymonky估值已经超过20亿美元;另一家快数据公司Qualtrics也刚以超过10亿美金的估值完成新一轮融资。
未来,快数据,大数据,如何发展,会水乳交融吗?让我们拭目以待。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
当 “算法” 成为数据科学、人工智能、业务决策领域的高频词时,一种隐形的认知误区正悄然蔓延 —— 有人将分析结果不佳归咎于 ...
2025-09-22在数据分析、金融计算、工程评估等领域,“平均数” 是描述数据集中趋势最常用的工具之一。但多数人提及 “平均数” 时,默认指 ...
2025-09-22CDA 数据分析师:参数估计助力数据决策的核心力量 在数字化浪潮席卷各行各业的当下,数据已成为驱动业务增长、优化运营效率的核 ...
2025-09-22训练与验证损失骤升:机器学习训练中的异常诊断与解决方案 在机器学习模型训练过程中,“损失曲线” 是反映模型学习状态的核心指 ...
2025-09-19解析 DataHub 与 Kafka:数据生态中两类核心工具的差异与协同 在数字化转型加速的今天,企业对数据的需求已从 “存储” 转向 “ ...
2025-09-19CDA 数据分析师:让统计基本概念成为业务决策的底层逻辑 统计基本概念是商业数据分析的 “基础语言”—— 从描述数据分布的 “均 ...
2025-09-19CDA 数据分析师:表结构数据 “获取 - 加工 - 使用” 全流程的赋能者 表结构数据(如数据库表、Excel 表、CSV 文件)是企业数字 ...
2025-09-19SQL Server 中 CONVERT 函数的日期转换:从基础用法到实战优化 在 SQL Server 的数据处理中,日期格式转换是高频需求 —— 无论 ...
2025-09-18MySQL 大表拆分与关联查询效率:打破 “拆分必慢” 的认知误区 在 MySQL 数据库管理中,“大表” 始终是性能优化绕不开的话题。 ...
2025-09-18DSGE 模型中的 Et:理性预期算子的内涵、作用与应用解析 动态随机一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明确:TIF 中的地名有哪两种存在形式? 在开始提取前,需先判断 TIF 文件的类型 —— ...
2025-09-17CDA 数据分析师:解锁表结构数据特征价值的专业核心 表结构数据(以 “行 - 列” 规范存储的结构化数据,如数据库表、Excel 表、 ...
2025-09-17Excel 导入数据含缺失值?详解 dropna 函数的功能与实战应用 在用 Python(如 pandas 库)处理 Excel 数据时,“缺失值” 是高频 ...
2025-09-16深入解析卡方检验与 t 检验:差异、适用场景与实践应用 在数据分析与统计学领域,假设检验是验证研究假设、判断数据差异是否 “ ...
2025-09-16CDA 数据分析师:掌控表格结构数据全功能周期的专业操盘手 表格结构数据(以 “行 - 列” 存储的结构化数据,如 Excel 表、数据 ...
2025-09-16MySQL 执行计划中 rows 数量的准确性解析:原理、影响因素与优化 在 MySQL SQL 调优中,EXPLAIN执行计划是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 对象的 text 与 content:区别、场景与实践指南 在 Python 进行 HTTP 网络请求开发时(如使用requests ...
2025-09-15CDA 数据分析师:激活表格结构数据价值的核心操盘手 表格结构数据(如 Excel 表格、数据库表)是企业最基础、最核心的数据形态 ...
2025-09-15Python HTTP 请求工具对比:urllib.request 与 requests 的核心差异与选择指南 在 Python 处理 HTTP 请求(如接口调用、数据爬取 ...
2025-09-12解决 pd.read_csv 读取长浮点数据的科学计数法问题 为帮助 Python 数据从业者解决pd.read_csv读取长浮点数据时的科学计数法问题 ...
2025-09-12