京公网安备 11010802034615号
经营许可证编号:京B2-20210330
小议大数据的“能”与“不能” _数据分析师
当下,我们正处于数据爆炸的时代,全球的数据量正在以每18个月翻一倍的惊人速度增长,世界正在高速数字化。大数据也是当下各行各业都在谈论的话题,某些数据分析师甚至扬言:如果可以实时、精确的捕捉一切数据,并且有足够高效的算法与储存设备,大数据可以分析并解决一切问题。窃以为,这样的说法太过绝对,现实情况并非如此。大数据并非是无所不能的。
笔者在这里试图从应用的角度分析一下电信行业大数据能做的和不能做的事情,而对于业务层面的能与不能。将留待后续文章再述。
大数据在面向客户层面能做的事情:
1、完善客户画像,洞察客户特征:拥有更全面的客户数据后,能更逼近客户的真实情况。大数据因其强大的数字记忆功能,在一定程度上能做到比客户自己还要更了解客户,具有读心术功能,这个容易理解;
2、发现行为模式的DNA,预测客户将发生的动作:法国数学家泊松说过:一旦我们承认人类行为是随机的,它突然之间就可以被预测了。《爆发》作者艾伯特拉斯洛巴拉巴西据此认为:依据泊松分布规律推断,人类行为93%是可以预测的。大数据的核心功能就是关联预测,比如识别离网客户在离网前的行为模式DNA,就能推测出所有在网客户在某个时期的离网率。类似的还有客户换机时间、偏好机型的预测等等。
3、识别客户需求偏好,开展个性化服务:还是围绕客户来说,大数据能发现客户的兴趣偏好、渠道偏好等,在规则引擎的实时触发作用下,相应的触点就能即时捕捉到机会,触发完成相应的动作,进行个性化的精准服务与营销,做到应时应景、正中客户下怀,这对于提高营销效率、客户感知肯定是大有裨益的,当然这里面还要注意让客户比较舒服的接受触点的服务,不要让客户觉得我们是在利用他们的隐私在做事情,这里面是讲究技巧的。
大数据在面向客户层面不能做的事情:
大数据的确能记录客户的各种属性特征、行为轨迹,这些数据也确实反映了客户的操作和使用行为,但是所思并不完全就是所想,客户的行为也不能完全反映其真实意图。
1、 大数据不能算出客户的创意和想象:大数据来源于现实,但是人类的许多想法并非来源于现实,创造性的思维与想象往往是天马行空、超越现实,因此《大数据时代》作者克托迈尔舍恩伯格直言:创意和想象,用大数据是算不出来的。
2、 大数据及时很智能也无法替代客户思维:大数据或许能帮助客户做出一些决策方案,但最终选择客户哪个方案、做出何种动作,最终决定权还是在客户自己手中。人类的思维过程、内心的真实想法是大数据不能够完全测算出来的。人类的思维、决策镶嵌在时间序列和社会背景之中,但数据是不能读懂这些背景的,也读不懂这些背景之后的一些潜规则,因而无法洞悉人类思维的浮现过程。即使是一部普通的小说,数据分析也无法解释其中的思路脉络,显见大数据是不能替代人类的思考的。
3、 大数据不能预测超越人类认知范围的事情:大数据的核心功能就是预测,但是大数据无法预测毫无先兆、超越人类认知极限的事情,这类事情通常被称为黑天鹅。大数据是基于历史数据来预测未来的,但当历史不可掌握时,大数据也是无计可施的;再者,大数据在采集、处理过程中难免被融入数据分析师的价值观和倾向性,这会让数据往往并非是原始客观的,会影响最后的分析结果,而真实的黑天鹅隐藏于无形之中,是很难被发现的;另外,著名思想、《黑天鹅:如何应对不可知的未来》的作者纳西姆塔勒布指出,随着我们掌握的数据越来越多,可以发现的统计上显著的相关关系也就越来越多,这些相关关系中,有很多都是没有实际意义的,在真正解决问题时可能将人引入歧途。
4、 大数据无法描述客户的感情:大数据另外一个局限性在于它很难表现和描述客户的感情。大数据在处理人类情感、社会关系、前后关联等问题的时候,表现往往不尽如人意。大数据只能告诉我们客户在做什么,而不能告诉我们客户在做的时候是怎么想的、背景是怎样的,或者客户在做的时候有什么样的情绪波动。所以,大数据往往是不能直达客户心智空间,理解客户拥有何种价值观的。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数据分析、业务监控、运营复盘等场景中,列值趋势计算是核心需求之一。无论是分析销售额的月度增长、用户活跃的变化趋势、库存 ...
2026-06-12在数字经济深度渗透的当下,消费者的购买行为已从过去的 “被动接受” 转变为 “主动决策”。流量红利消退、获客成本攀升、用户 ...
2026-06-12CDA三级认证是三个级别中的塔尖,全面考察数据战略、团队领导和复杂项目的综合能力。它所对应的《敏捷数据挖掘》教材,不再局限 ...
2026-06-12在游戏产业的商业逻辑中,付费玩家是支撑游戏生存与发展的核心支柱。行业普遍遵循 “二八定律”:20% 的付费玩家贡献了游戏 80% ...
2026-06-11【核心关键词】企业、定位、传统、产品、互联网、可视化、业务侧、数字化、结构化、数据分析、传统制造业、市场状态、发展空间 ...
2026-06-11 解读《CDA二级教材:量化策略分析(2025)》的全景结构与学习逻辑 ” CDA二级认证是企业招聘数据分析师时最常提及的证书门槛 ...
2026-06-11【核心关键词】药企、可视化、营销、分类、数据分析师、销售数据、业务人员、指导方向、分析报告、营销数据、营销医生 【专访摘 ...
2026-06-10在统计学分析、问卷调研、实验验证、业务复盘等场景中,卡方检验与 T 检验是应用最广泛的两类基础假设检验方法。前者专门处理分 ...
2026-06-10 很多数据分析师每天都在计算指标、制作报表,但当被问到“什么叫指标数据元”“指标数据标准包含哪些核心维度”“指标数据质 ...
2026-06-10在MySQL数据库日常查询、数据统计、后台接口开发、数据导出等场景中,开发者经常需要查询数据表除某几列之外的所有字段。例如查 ...
2026-06-09在Python网络请求、爬虫开发、接口测试、数据抓取等实操场景中,requests库是最常用的第三方请求工具,而content属性是requests ...
2026-06-09 数据分析正在重塑每一个行业。CDA认证的三本官方教材,分别对应Level I、Level II、Level III,为你铺就从业务数据分析到数 ...
2026-06-09在数字财务、智慧财税、业财融合深度推进的当下,传统财务模式下数据标准混乱、业务流程碎片化、知识无法沉淀、系统互通性差等问 ...
2026-06-08随着数字经济深度渗透各行各业,数据正式成为继土地、劳动力、资本、技术之后的第五大生产要素,是企业数字化转型、精细化运营、 ...
2026-06-08 很多数据分析师能熟练写SQL、做透视表,但当被问到“数据是从哪里来的?经过哪些加工才进入数据仓库?ETL具体做了什么?”时 ...
2026-06-08【核心关键词】贷款、报表、课程、专业、建模、缺失值、营销、互联网、银行、办公自动化、数据分析、数据预处理、特征工程、贷 ...
2026-06-05在数据库数据查询、业务报表统计、多表关联分析中,LEFT JOIN左连接是使用率最高的SQL关联查询语句。其核心特性是保留左表全部数 ...
2026-06-05 很多数据分析师能熟练地写SQL、做透视表、算描述性统计,但当被问到“如何预测用户流失概率”“如何归因销量下滑的关键因素 ...
2026-06-05任何一款产品从诞生、普及到最终退出市场,都会遵循一套固定的发展规律,这就是产品生命周期理论。在市场竞争日益激烈、产品迭代 ...
2026-06-04在Excel数据分析、办公统计、业务报表制作场景中,数据透视表是数据汇总、分类统计、快速复盘的核心工具,能够高效完成海量原始 ...
2026-06-04