京公网安备 11010802034615号
经营许可证编号:京B2-20210330
在中国传统文化里,人们受制于模糊思维,往往忽视数据,或感觉差不多、无所谓,一个普遍现实是:数据难以有效地指导行动。
文/涂子沛(微信公众号:涂子沛频道)
这个清明多风雨,高速路上不太平。
期间最重大的事故,当属沪宁高速常州段56车连环相撞,其主要原因被确定为雨天路滑和团雾,但我认为还另有原因。
再看数据,截止2015年底,中国高速公路里程突破12万公里,汽车1.72亿辆,而美国为9.2万公里、2.8亿辆。理论上,中国的路更多、车更少,交通应该比美国更安全。但2014年,美国因交通事故导致的死亡人数为32675人,我遍寻网络,中国官方数据缺失。而据世界卫生组织估计,中国每年因交通事故死亡的人数超过20万。
供给侧,我们的高速公路多于美国,需求侧,我们的汽车保有量低于美国,但我们的死亡人数,无论是绝对数量、还是相对比率,都高于美国!
问题,到底出在哪里?
高速路要学博物馆,控制流量
除了气候等客观原因,我认为,中国高速上的连环撞,事出“数据化管理”严重不足。
任何一条公路,容量都有限,因此存在一个“饱和流量”和“科学密度”。节假日期间,车辆骤然增多,中国的道路应该进行流量调控。这种调控并非限制特定车辆上高速,而是将相关的数据实时告诉驾驶员,然后用各种方式调控车流。
国内不少人流密度高的公共场所都做了类似尝试。今年春节期间,我带孩子到上海科技馆参观,发现科技馆售票处有一块显示“当前馆内人数”的电子牌,续而了解到,当馆内游客逼近1万人的“红线”时,馆方就暂停售票、放慢安检速度或分批放行。出馆人数增多后,限流措施随之解除。
流量调控电子屏实时显示馆内人数为9561人
就避免拥堵而言,高速公路和博物馆、游乐场道理相通。任何一条道路上,其流量都有一个“科学密度”,一旦超过,问题隐现。
行进之中的车辆如果靠得太近太紧,驾驶员会产生紧张感、不舒感,其本能反应就是刹车,每次刹车,对后面的车都会产生一股“负冲击波”,跟行的车也必须刹车,不可预见的频繁刹车,整个交通流就被扰乱了,人心随即被扰乱,抱怨、鸣笛、抢道,交通事故的巨大阴影开始蔓延。
在道路流量控制上,美国明尼苏达州的双子城堪称榜样。它们从1970年代开始就反复试点“匝道信号调控”(Ramp Metering):通过在匝道上设置信号灯,调控进入高速公路的车辆。
匝道是指引导车辆从支路进入主干线的一小段辅路、或称接驳路段
该市交通管理部门通过大数据调研,确定该市绕城高速上的饱和流量为“每小时3900辆”,即一旦超过3900的临界点,高速公路就会拥堵,通行速度就会下降。
交通部门因此开始监测,路段上的车辆只要一过3900,匝道上的信号灯就会打开,对进入的车流进行调控,即需要等待才能进入,一次绿灯亮,一台车进入,另一个探测头会监控匝道上的排队等待的车辆数量,当队伍太长、溢出匝道的时候,控制灯就加快放行的速度。
该市一共在430多个匝道上安装了信号调控灯。别小看这一个小小的措施,经过反复对比测试,专家最终发现,在没有匝道的流量控制的情况下,高峰期间撞车事故增加了26%、穿越全程高速的时间增加了22%、而公路的最大流量却下降9%、车辆平均行驶速度下降7%。
今天的信息技术,已经远非1970年代可比,通过云计算、传感器、摄像头,中国肯定可以构建更合理的数学模型和技术框架,实现更精准的预测和导流。对此,我很有信心。
尽快摒弃忽视数据的惯性思维
常州车祸当天,天气预报有大雨,为何还有这么多人选择出门?其中原因可能很多,如长假难得、情感纽带等等,但这里也涉及大众对天气数据的使用。我的感受是,虽然已经进入了信息社会,但中国社会很多人对数据视而不见、近乎无感,也就是不懂得怎样用数据分析现实、预测结果、管理指导自己的生活。
在中国传统文化里,人们受制于模糊思维,往往忽视数据、或感觉“数据大一点、小一点”差不多、无所谓,一个普遍现实是:数据难以有效地指导行动。
千千万的司机,亟待建立数据意识,用天气数据指导出行,主动规避风险。
在常州车祸中,倘若大部分司机能够及时掌握并使用天气数据、高速公路流量饱和数、实际行车数等数据,拥堵就可能缓解,悲剧或可避免。
当然,前提是这些数据本身要准。话说回来,中国大众使用数据的意识和习惯差,跟中国的天气数据服务欠佳也有关系,美国的预报精确到每个小时,还很准,国内以前的预报却常常不准,大家就不在乎了,养成了“无数据走天下”的思维定式。
但我发现,中国的天气预报最近几年一直在进步,准确率已大大提高,现在值得信赖。气象部门的下一个工作重点,应该多想办法改善服务,把数据更快更好的传递给大众。
数据是解决交通问题的终极办法
此外,还有人妄言,解决交通拥堵的根本方法是修路。对此,我还是不同意。
路要修,但要靠“修路”解决交通问题,只是一厢情愿。即使再修建新的高速,原来的公交出行者、错峰出行者、不上高速者,会重新调整自己的出行行为,蜂拥占领新的高速公路。这种“越修越堵”的窘状,已经在美国、日本、欧洲的大城市不断上演过了。
资源有限,总有一天,无论是在北京、还是在纽约,东京,我们会发现整个地表已经没有办法增加一条新的道路。
而人类智慧无限。交通,是一个可以完全量化的领域。我相信,通过不断的“数据优化”,可以最终实现人类、汽车与公路的有序相处,而不是碰撞、碾压、鲜血和死亡。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
当沃尔玛数据分析师首次发现 “啤酒与尿布” 的高频共现规律时,他们揭开了数据挖掘最迷人的面纱 —— 那些隐藏在消费行为背后 ...
2025-11-03这个问题精准切中了配对样本统计检验的核心差异点,理解二者区别是避免统计方法误用的关键。核心结论是:stats.ttest_rel(配对 ...
2025-11-03在 CDA(Certified Data Analyst)数据分析师的工作中,“高维数据的潜在规律挖掘” 是进阶需求 —— 例如用户行为包含 “浏览次 ...
2025-11-03在 MySQL 数据查询中,“按顺序计数” 是高频需求 —— 例如 “统计近 7 天每日订单量”“按用户 ID 顺序展示消费记录”“按产品 ...
2025-10-31在数据分析中,“累计百分比” 是衡量 “部分与整体关系” 的核心指标 —— 它通过 “逐步累加的占比”,直观呈现数据的分布特征 ...
2025-10-31在 CDA(Certified Data Analyst)数据分析师的工作中,“二分类预测” 是高频需求 —— 例如 “预测用户是否会流失”“判断客户 ...
2025-10-31在 MySQL 实际应用中,“频繁写入同一表” 是常见场景 —— 如实时日志存储(用户操作日志、系统运行日志)、高频交易记录(支付 ...
2025-10-30为帮助教育工作者、研究者科学分析 “班级规模” 与 “平均成绩” 的关联关系,我将从相关系数的核心定义与类型切入,详解 “数 ...
2025-10-30对 CDA(Certified Data Analyst)数据分析师而言,“相关系数” 不是简单的数字计算,而是 “从业务问题出发,量化变量间关联强 ...
2025-10-30在构建前向神经网络(Feedforward Neural Network,简称 FNN)时,“隐藏层数目设多少?每个隐藏层该放多少个神经元?” 是每个 ...
2025-10-29这个问题切中了 Excel 用户的常见困惑 —— 将 “数据可视化工具” 与 “数据挖掘算法” 的功能边界混淆。核心结论是:Excel 透 ...
2025-10-29在 CDA(Certified Data Analyst)数据分析师的工作中,“多组数据差异验证” 是高频需求 —— 例如 “3 家门店的销售额是否有显 ...
2025-10-29在数据分析中,“正态分布” 是许多统计方法(如 t 检验、方差分析、线性回归)的核心假设 —— 数据符合正态分布时,统计检验的 ...
2025-10-28箱线图(Box Plot)作为展示数据分布的核心统计图表,能直观呈现数据的中位数、四分位数、离散程度与异常值,是质量控制、实验分 ...
2025-10-28在 CDA(Certified Data Analyst)数据分析师的工作中,“分类变量关联分析” 是高频需求 —— 例如 “用户性别是否影响支付方式 ...
2025-10-28在数据可视化领域,单一图表往往难以承载多维度信息 —— 力导向图擅长展现节点间的关联结构与空间分布,却无法直观呈现 “流量 ...
2025-10-27这个问题问到了 Tableau 中两个核心行级函数的经典组合,理解它能帮你快速实现 “相对位置占比” 的分析需求。“index ()/size ( ...
2025-10-27对 CDA(Certified Data Analyst)数据分析师而言,“假设检验” 绝非 “套用统计公式的机械操作”,而是 “将模糊的业务猜想转 ...
2025-10-27在数字化运营中,“凭感觉做决策” 早已成为过去式 —— 运营指标作为业务增长的 “晴雨表” 与 “导航仪”,直接决定了运营动作 ...
2025-10-24在卷积神经网络(CNN)的训练中,“卷积层(Conv)后是否添加归一化(如 BN、LN)和激活函数(如 ReLU、GELU)” 是每个开发者都 ...
2025-10-24