京公网安备 11010802034615号
经营许可证编号:京B2-20210330
预测未来,最忌参考过去
如今我们做大量预测,Forrester 这种调研公司尤其喜欢通过图表预测设备销量、媒体广告支出,认为任何可量化的东西,它都可以被预测。这些预测报告通常有些常见模板,比如:
“今年,我们位于 X 轴的中心”、“我们可以看到在这个日期前有 3 个数据点”、“我们可以看到未来 X 年内,会有一个完美的线性发展趋势。”但是没人知道这有多蠢吗?
无广告社交项目 Ello 推出后不久,已经有人在预测它的用户数会“超过地球人口”。然后用同样方法,预测 2009 年美国智能手机销量,得到结论也相似,或者去预测移动端广告支出,他们可以傻到一直这么做。
不信?可以看看这些显著案例。

到底是什么让我们如此肯定: 2016 年搜索营销价值会接近 100 万美元?
有预测认为:2020 年食品和饮料在电子商务中只占很小份额。它完全不考虑那时人们生活可能是什么样,或者会有什么新行业或新技术出现。
我最喜欢的一张蠢成这样的图是下面这个,它蠢到没搞清楚我们现在是在几几年(图表中说我们现在身处 2015 年)。接下来是什么?预测无人驾驶汽车销量?或者 4D 打印机?还是智能机器人助理?

而你知不知道他们从不使用的图表?我们来把他们预测的和实际情况做下比较,真实的图表是下面这样的:
如上图,诺基亚一直做得很好,直到开始表现不佳。
如上图,音乐产业总是面对翻天覆变化,但现在开始直线下滑。
如上图,最生动的是印刷广告业的衰落。
当然,以上这些不是说 Forrester 很蠢或这些图表一文不值,只是说,真正的问题在于:未来其实很难预测,因为“未来”它从不是线性发展的。事实上,这个时代的一个关键要素是:事物有快速变化趋势。它可能是 Airbnb 在房屋租赁市场异军突起,可能是 Uber 改变人们出行方式,或是特斯拉在电动汽车领域掀起革命,或是 Apple pay 重塑支付行业。实际上,现实发展比我们想象的更快。
同时,不是所有事都在变,比如我点一杯咖啡的方式和十年前没什么不同;再比如我买衣物柔顺剂也一样,而银行模样,和 25 年前一样。
这其中,还有些事是周期性的,比如我们可能认为中国有史以来第一次变富,但历史表明:它一度是主要世界经济体。而还有很多事,它完全不受过去束缚,比如我现在把 Twitter 作为浏览器主页,没选择雅虎。我现在无休止看手机,无论何时我都在用非接触方式“使用”它。智能手机的崛起渐渐改变我们行为方式,产品不断数字化塑造全新的所有权模式,许多作为中间环节的行业已经快要消失,而新兴企业在网络效应下呈指数增长。许多事物的变化越来越快越来越快。
那面对这种变革,我们要做的,就不仅仅是根据历史演进做预测,而应该:
理解哪些事物发生了变化,哪些保持不变。
从足够远的过去学习,不要以为时间越近就越具参考价值,应该在更长的时间尺度发现相似案例。
做艺术化、移情预测,预测什么“现实”可能发生,而这些预测是基于想象力及已经定义边界后的“合理性”(based on imagination and defining edges to plausibility)。
其实我们很难说“将来”会是什么样,包括竞争对手的活动,新产品、新应用、新技术、世界经济、新规则、新商业模式都可能出现。但我们去对事情本身做“肠道检查”却没那么难,我们可以很容易排除一些事,并依次对另一些事做假设,设定一些可能场景,然后推断其合理性。
这样做可能不完美,但比那些预测未来的随机线条更可能正确,它建立我们对预测结果的一定程度的信心。
有人说,历史是伟大的老师,但事实真是如此吗?难道因为以前不流行六度空间理论,Facebook 就该放弃它的事业?难道我们应该向 WebVan 学习,就不去尝试电子商务?WebTV 彻底失败,Netflix 却大获成功。历史还告诉过我们,人们不信 4 分钟内可以跑一英里,认为背越式跳高不值得考虑,触屏手机无法正常工作。
所以也许对更大块的东西来说,“历史”是个更显得蹩脚的老师。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数据分析与建模中,“显性特征”(如用户年龄、订单金额、商品类别)是直接可获取的基础数据,但真正驱动业务突破的往往是 “ ...
2025-11-07在大模型(LLM)商业化落地过程中,“结果稳定性” 是比 “单次输出质量” 更关键的指标 —— 对客服对话而言,相同问题需给出一 ...
2025-11-07在数据驱动与合规监管双重压力下,企业数据安全已从 “技术防护” 升级为 “战略刚需”—— 既要应对《个人信息保护法》《数据安 ...
2025-11-07在机器学习领域,“分类模型” 是解决 “类别预测” 问题的核心工具 —— 从 “垃圾邮件识别(是 / 否)” 到 “疾病诊断(良性 ...
2025-11-06在数据分析中,面对 “性别与购物偏好”“年龄段与消费频次”“职业与 APP 使用习惯” 这类成对的分类变量,我们常常需要回答: ...
2025-11-06在 CDA(Certified Data Analyst)数据分析师的工作中,“可解释性建模” 与 “业务规则提取” 是核心需求 —— 例如 “预测用户 ...
2025-11-06在分类变量关联分析中(如 “吸烟与肺癌的关系”“性别与疾病发病率的关联”),卡方检验 P 值与 OR 值(比值比,Odds Ratio)是 ...
2025-11-05CDA 数据分析师的核心价值,不在于复杂的模型公式,而在于将数据转化为可落地的商业行动。脱离业务场景的分析只是 “纸上谈兵” ...
2025-11-05教材入口:https://edu.cda.cn/goods/show/3151 “纲举目张,执本末从。” 若想在数据分析领域有所收获,一套合适的学习教材至 ...
2025-11-05教材入口:https://edu.cda.cn/goods/show/3151 “纲举目张,执本末从。” 若想在数据分析领域有所收获,一套合适的学习教材至 ...
2025-11-04【2025最新版】CDA考试教材:CDA教材一级:商业数据分析(2025)__商业数据分析_cda教材_考试教材 (cdaglobal.com) ...
2025-11-04在数字化时代,数据挖掘不再是实验室里的技术探索,而是驱动商业决策的核心能力 —— 它能从海量数据中挖掘出 “降低成本、提升 ...
2025-11-04在 DDPM(Denoising Diffusion Probabilistic Models)训练过程中,开发者最常困惑的问题莫过于:“我的模型 loss 降到多少才算 ...
2025-11-04在 CDA(Certified Data Analyst)数据分析师的工作中,“无监督样本分组” 是高频需求 —— 例如 “将用户按行为特征分为高价值 ...
2025-11-04当沃尔玛数据分析师首次发现 “啤酒与尿布” 的高频共现规律时,他们揭开了数据挖掘最迷人的面纱 —— 那些隐藏在消费行为背后 ...
2025-11-03这个问题精准切中了配对样本统计检验的核心差异点,理解二者区别是避免统计方法误用的关键。核心结论是:stats.ttest_rel(配对 ...
2025-11-03在 CDA(Certified Data Analyst)数据分析师的工作中,“高维数据的潜在规律挖掘” 是进阶需求 —— 例如用户行为包含 “浏览次 ...
2025-11-03在 MySQL 数据查询中,“按顺序计数” 是高频需求 —— 例如 “统计近 7 天每日订单量”“按用户 ID 顺序展示消费记录”“按产品 ...
2025-10-31在数据分析中,“累计百分比” 是衡量 “部分与整体关系” 的核心指标 —— 它通过 “逐步累加的占比”,直观呈现数据的分布特征 ...
2025-10-31在 CDA(Certified Data Analyst)数据分析师的工作中,“二分类预测” 是高频需求 —— 例如 “预测用户是否会流失”“判断客户 ...
2025-10-31