京公网安备 11010802034615号
			经营许可证编号:京B2-20210330
		从经验思维到实证思维的转变
比起“大数据”,我更喜欢“数据科学”的提法,这是因为:第一,在今后的分享中,我会更偏向于从技术层面探讨如何利用数据优化管理决策;第二,数据量的大小固然重要,然而数据能否提升管理水平,更取决于管理者能否从经验思维转变为科学思维,或者更确切地说,转变为实证思维。所以我想在这管理学家的领地上多谈谈科学。
	
中国人多以经验思维为主,其特点是判断多而论证少。即便有论证,也是基于逻辑的辩证多,基于数据的实证少。只要留意一下每天的新闻,就会发现经验思维的例子比比皆是。拿一条新闻 “北京中秋前进入最堵一周” 来说,媒体的普遍判断是中秋前堵车是因为人们节前纷纷跑到北京去送礼。这一判断符合我们的经验,似乎也符合逻辑,但是却恰恰缺乏实证。若从实证的角度验证这一判断,我们要回答以下两个问题:为什么说这是最堵的一周?如何证明这最堵的一周是由人们从外地到北京送礼造成的?
要从实证的角度来回答第一个问题,首先要确定“堵”的衡量方式,比如说是以平均车速,或者平均车流量;“平均”又是在哪些时段上,哪些地区内,针对哪些车型(是否包括公交车)。然后,我们需要足够多年份的每周“堵车”数据来支持我们的说法。最后,我们还需要收集尽可能多的控制变量数据,譬如每年中秋与国庆的间隔天数、天气状况、重要会议及活动、道路施工情况、北京的拥车情况、街道面积、高速里程、地铁线路演变等等,因为这些因素都有可能影响堵车并影响我们对“中秋前是最堵一周”的证明。
可见,要从数据科学的角度很好地回答第一个问题并不容易,而要实证地回答第二个问题就更困难了。我们需要知道:每周有多少外地车辆进北京?是否中秋前的一周外地车最多?这些外地车辆是不是来送礼的?来送礼的外地车辆都在什么时间,什么地点出现?当他们出现时,是否直接观测到了拥堵?如果没有直接观测到来送礼的外地车辆造成了拥堵,是否是本地车辆为了避开这些来送礼的外地车造成了其他时间,其他地点的拥堵?
从实证的角度做了这番思考,我们会发现,一个凭经验得出的判断竟然如此难以证明。其实,如果我们尝试用数据科学的方法论来审视一下我们在管理中所做的判断,我们同样会吃惊于很多判断极度缺乏实证依据。而这种将经验思维转变为实证思维所带来的阵痛与震撼,却是我们通向数据科学时代,通向数据驱动的管理决策必经的关键一步。
这种从经验思维到实证思维的转变,不仅是管理观念的转变,还会带来操作层面和技术层面上的转变。从对“北京中秋前进入最堵一周”的实证思考,我们实际上也对哪些数据会有用,哪些数据需要进一步收集,数据分析中哪些因素需要得到控制等等,有了更清晰的认识。并且,在对收集到的数据进一步做实证分析的过程中,我们的原有认识有可能会被颠覆,从而成为展开新一轮实证思考和数据收集的起点。比如说,通过对各主要路口的监控视频进行分析,我们可能并没有发现外来车辆的增加,但是却发现本地公车牌照的出现频率比往常要高。如果有这样的发现,我们对拥堵成因的判断就要修正,进一步的数据收集重点也会随之转到公车使用上了。
尤为重要的是,从经验思维到实证思维的转变,还能帮助我们找到更为高效和低成本的解决方案。还是拿堵车作为例子,基于经验思维的判断,往往会导致兴师动众、社会成本很高的解决方案,譬如限制外来车辆入京。而基于数据和实证分析的解决方案可能会是提高某些时段,某些区域内的停车费用;或是调节相应时段区域内的左转和右转限制及红绿灯的间隔等。相比之下,这样做的成本要小很多。
一直在用堵车说事,这看似只是政府公共管理的范畴,但其实解决堵车问题对企业的运营和营销也会有影响。中秋节大家都要吃月饼,而这些年来,哈根达斯冰淇淋月饼已经成为一线城市中月饼的新宠儿。在促进哈根达斯月饼成功的因素中,其团队运用实证思维来解决堵车问题也功不可没。一开始,团队选在离高速公路出口很近的地点建立临时月饼领取点。从经验思维的角度,这似乎很有道理,因为方便了消费者。但是团队很快发现这样做导致了交通阻塞,不仅降低了顾客的满意度,也招来了政府交通部门的抱怨。之后其团队从实证思维的角度,通过对顾客流量的时间空间分布的分析,优化了领取点的设置、产品配送和领取流程。顾客的体验和忠诚度自然也提升了。
令人高兴的是,实证思维和基于数据的管理决策观念正慢慢地深入人心。大家可能注意到临近中秋时,不少网友吐槽“五仁月饼”难吃,并将其炒成了一个热门话题。然而媒体朋友们并非人云亦云,而是通过问卷调查、销量统计的方法为“五仁月饼”正了名。据9月18日《新京报》报道,消费者对五仁月饼评价排名第二,销量良好,甚至部分店铺都脱销了。媒体需要这样的实证思维,企业管理者也需要这样的实证思维。
                  数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在 DDPM(Denoising Diffusion Probabilistic Models)训练过程中,开发者最常困惑的问题莫过于:“我的模型 loss 降到多少才算 ...
2025-11-04在 CDA(Certified Data Analyst)数据分析师的工作中,“无监督样本分组” 是高频需求 —— 例如 “将用户按行为特征分为高价值 ...
2025-11-04当沃尔玛数据分析师首次发现 “啤酒与尿布” 的高频共现规律时,他们揭开了数据挖掘最迷人的面纱 —— 那些隐藏在消费行为背后 ...
2025-11-03这个问题精准切中了配对样本统计检验的核心差异点,理解二者区别是避免统计方法误用的关键。核心结论是:stats.ttest_rel(配对 ...
2025-11-03在 CDA(Certified Data Analyst)数据分析师的工作中,“高维数据的潜在规律挖掘” 是进阶需求 —— 例如用户行为包含 “浏览次 ...
2025-11-03在 MySQL 数据查询中,“按顺序计数” 是高频需求 —— 例如 “统计近 7 天每日订单量”“按用户 ID 顺序展示消费记录”“按产品 ...
2025-10-31在数据分析中,“累计百分比” 是衡量 “部分与整体关系” 的核心指标 —— 它通过 “逐步累加的占比”,直观呈现数据的分布特征 ...
2025-10-31在 CDA(Certified Data Analyst)数据分析师的工作中,“二分类预测” 是高频需求 —— 例如 “预测用户是否会流失”“判断客户 ...
2025-10-31在 MySQL 实际应用中,“频繁写入同一表” 是常见场景 —— 如实时日志存储(用户操作日志、系统运行日志)、高频交易记录(支付 ...
2025-10-30为帮助教育工作者、研究者科学分析 “班级规模” 与 “平均成绩” 的关联关系,我将从相关系数的核心定义与类型切入,详解 “数 ...
2025-10-30对 CDA(Certified Data Analyst)数据分析师而言,“相关系数” 不是简单的数字计算,而是 “从业务问题出发,量化变量间关联强 ...
2025-10-30在构建前向神经网络(Feedforward Neural Network,简称 FNN)时,“隐藏层数目设多少?每个隐藏层该放多少个神经元?” 是每个 ...
2025-10-29这个问题切中了 Excel 用户的常见困惑 —— 将 “数据可视化工具” 与 “数据挖掘算法” 的功能边界混淆。核心结论是:Excel 透 ...
2025-10-29在 CDA(Certified Data Analyst)数据分析师的工作中,“多组数据差异验证” 是高频需求 —— 例如 “3 家门店的销售额是否有显 ...
2025-10-29在数据分析中,“正态分布” 是许多统计方法(如 t 检验、方差分析、线性回归)的核心假设 —— 数据符合正态分布时,统计检验的 ...
2025-10-28箱线图(Box Plot)作为展示数据分布的核心统计图表,能直观呈现数据的中位数、四分位数、离散程度与异常值,是质量控制、实验分 ...
2025-10-28在 CDA(Certified Data Analyst)数据分析师的工作中,“分类变量关联分析” 是高频需求 —— 例如 “用户性别是否影响支付方式 ...
2025-10-28在数据可视化领域,单一图表往往难以承载多维度信息 —— 力导向图擅长展现节点间的关联结构与空间分布,却无法直观呈现 “流量 ...
2025-10-27这个问题问到了 Tableau 中两个核心行级函数的经典组合,理解它能帮你快速实现 “相对位置占比” 的分析需求。“index ()/size ( ...
2025-10-27对 CDA(Certified Data Analyst)数据分析师而言,“假设检验” 绝非 “套用统计公式的机械操作”,而是 “将模糊的业务猜想转 ...
2025-10-27