京公网安备 11010802034615号
经营许可证编号:京B2-20210330
我要说的第一个案例是大数据如何减少美国医院急救数量。
因为美国急救价格很贵,而很多需要急救的病人没有医疗保险,美国政府在支付急救费用上承担着大量花费,但是最近一个非营利性组织 Code for America 发现:其实美国医院急救问题的症结不在于有很多人打急救电话,而在于总是有一部分人一次又一次打急救电话。
他们给我举的一个例子是:有个老人被发现一个月内有四次因为中风被送入急救室,但原因其实不是老人没有治疗中风的药,而是这个老人的家人总是在偷她的药片卖钱。
解决方法因此变得很简单了,那就是买一个带锁的医疗箱给她。自那以后,这个老人再没有中风过。
所以如果美国政府要省下费用,他们只需把这部分大量使用急救资源的病人找出来,然后在他们被送往急救前就解决他们身上更深层次的问题。接下来是怎么收集大数据,这就涉及到美国多个部门的合作:包括美国消防局、警察局和城市规划局。
因为消防局和警察局有每个急救电话的种类、地址和时间等信息,它们两个部门基本可以确定是哪些地址的患者在频繁打急救电话;而城市规划局(或工商局)有这个地址属于什么种类建筑的信息,它可以用来决定派遣什么样的人员前往。
比如如果一个月打 4 次急救电话的地址是“居民楼”,那就需要派一个护士过去看看什么情况;而如果一个月打 4 次急救电话的地址是“餐馆”,那就需要派其他种类的人去。
交通其实是个大热点,每时每刻都在产生大量有价值信息,但不同交通信息系统目的是不一样的,比如地铁、地铁的检票站能够确定乘客从哪个站进、哪个站出;而调度系统则能确定在某个时段有几班车从哪里开往哪里。
这两个系统的数据分开各有各的用处,但如果将它们整合,基本就能知道某个时刻某班车上有多少乘客、拥挤度如何等,比如如果过分拥挤,你可以决定增加运力。
另一个例子是:一个乘客从 A 到 B,他需要先乘坐公交车,然后再乘坐地铁。通常,这个乘客数据是分别存在地铁和公交两个系统,所以数据到了美国交通管理部门,即使只是一个乘客从 A 到 B,它也会被认为是两次不同的行程。
但如果将公交和地铁数据整合后会发生什么呢?美国交通管理部门会把从 A 到 B 的两次旅行连在一起,确认为是一次行程,而如果发现有大量人的实际需求其实是从 A 到 B,而非是从 A 到某一个中间点 C,那么市政府就会考虑是否直接做一个从 A 到 B 的路线。
在旧金山送外卖的创业公司最近非常火,Sprig 和 SpoonRocket 都拿到了千万美金级别的融资,它们模式是在网上或手机上点单,然后自己雇人做健康营养的快餐,派人送到用户手中。重要的信息来了,Sprig在6月初招募 了 Uber 做大数据的 Angela Wise,而 SpoonRocket 也刚刚招募了一个人做大数据。
为什么一个做外卖的也对大数据这么热情?因为通过用户数据分析,他们能提前预测在哪个地区、什么时间用户订单可能会一下爆棚,由此,外卖公司可以提前调整运力并缩短用户等待时间,因为外卖公司的用户体验很大程度取决于能否在用户下订单后 10-20 分钟内把快餐送到。
这些公司也使用大数据做外卖车辆的路线优化,目的是保证如何以最有效、最省成本方式将快餐送到用户手里。
当然,美国这里的外卖不像中国写字楼里的外卖,它不是每天中午 11 点 30 分写个单子,然后 12 点送到,美国的外卖基本都是随时点、随时送,所以做预测就非常重要。
而实际上,大数据应用也对公司扩张决策起到指导作用。比如 SpoonRocket 创始人告诉我,他正考虑跳出旧金山进入像洛杉矶、西雅图等西海岸其它城市,但进入哪个城市对 SpoonRocket 业务有最大好处?大数据可以帮他排出不同城市优先级,使 SpoonRocket 能选择优先进入的城市。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在机器学习领域,“分类模型” 是解决 “类别预测” 问题的核心工具 —— 从 “垃圾邮件识别(是 / 否)” 到 “疾病诊断(良性 ...
2025-11-06在数据分析中,面对 “性别与购物偏好”“年龄段与消费频次”“职业与 APP 使用习惯” 这类成对的分类变量,我们常常需要回答: ...
2025-11-06在 CDA(Certified Data Analyst)数据分析师的工作中,“可解释性建模” 与 “业务规则提取” 是核心需求 —— 例如 “预测用户 ...
2025-11-06在分类变量关联分析中(如 “吸烟与肺癌的关系”“性别与疾病发病率的关联”),卡方检验 P 值与 OR 值(比值比,Odds Ratio)是 ...
2025-11-05CDA 数据分析师的核心价值,不在于复杂的模型公式,而在于将数据转化为可落地的商业行动。脱离业务场景的分析只是 “纸上谈兵” ...
2025-11-05教材入口:https://edu.cda.cn/goods/show/3151 “纲举目张,执本末从。” 若想在数据分析领域有所收获,一套合适的学习教材至 ...
2025-11-05教材入口:https://edu.cda.cn/goods/show/3151 “纲举目张,执本末从。” 若想在数据分析领域有所收获,一套合适的学习教材至 ...
2025-11-04【2025最新版】CDA考试教材:CDA教材一级:商业数据分析(2025)__商业数据分析_cda教材_考试教材 (cdaglobal.com) ...
2025-11-04在数字化时代,数据挖掘不再是实验室里的技术探索,而是驱动商业决策的核心能力 —— 它能从海量数据中挖掘出 “降低成本、提升 ...
2025-11-04在 DDPM(Denoising Diffusion Probabilistic Models)训练过程中,开发者最常困惑的问题莫过于:“我的模型 loss 降到多少才算 ...
2025-11-04在 CDA(Certified Data Analyst)数据分析师的工作中,“无监督样本分组” 是高频需求 —— 例如 “将用户按行为特征分为高价值 ...
2025-11-04当沃尔玛数据分析师首次发现 “啤酒与尿布” 的高频共现规律时,他们揭开了数据挖掘最迷人的面纱 —— 那些隐藏在消费行为背后 ...
2025-11-03这个问题精准切中了配对样本统计检验的核心差异点,理解二者区别是避免统计方法误用的关键。核心结论是:stats.ttest_rel(配对 ...
2025-11-03在 CDA(Certified Data Analyst)数据分析师的工作中,“高维数据的潜在规律挖掘” 是进阶需求 —— 例如用户行为包含 “浏览次 ...
2025-11-03在 MySQL 数据查询中,“按顺序计数” 是高频需求 —— 例如 “统计近 7 天每日订单量”“按用户 ID 顺序展示消费记录”“按产品 ...
2025-10-31在数据分析中,“累计百分比” 是衡量 “部分与整体关系” 的核心指标 —— 它通过 “逐步累加的占比”,直观呈现数据的分布特征 ...
2025-10-31在 CDA(Certified Data Analyst)数据分析师的工作中,“二分类预测” 是高频需求 —— 例如 “预测用户是否会流失”“判断客户 ...
2025-10-31在 MySQL 实际应用中,“频繁写入同一表” 是常见场景 —— 如实时日志存储(用户操作日志、系统运行日志)、高频交易记录(支付 ...
2025-10-30为帮助教育工作者、研究者科学分析 “班级规模” 与 “平均成绩” 的关联关系,我将从相关系数的核心定义与类型切入,详解 “数 ...
2025-10-30对 CDA(Certified Data Analyst)数据分析师而言,“相关系数” 不是简单的数字计算,而是 “从业务问题出发,量化变量间关联强 ...
2025-10-30