京公网安备 11010802034615号
经营许可证编号:京B2-20210330
当你开车路过一家餐厅的停车场时,你的手机屏幕上弹出了这家餐厅的当日特价菜品推荐,这种体验是不是很棒?如果赌场老板把发牌人忘记付给你的20美元亲自送还给你,你的心里是不是有点儿小激动?如果在线视频游戏能够把和我们玩法相近的用户即刻告知我们,这世界会不会变得很美妙?你是不是要下调汽车保险费率?大数据能让这一切变成现实。
网络数据即使不是最原始的大数据源,也是使用最广泛、认可度最高的大数据源。除此之外,还有很多大数据源,它们都有各自的使用价值。其中一些广为人知,而另一些几乎没有名气。我们在此要借用本章的篇幅一起来回顾除网络数据以外的其他9 种大数据源以及它们的用途。我们将站在一个较高的层次上讲解这部分内容,意图是在简单描述各类数据源的基础上,回顾每种大数据源的应用与商业含义。
我们发现了一个非常明显的趋势,各行各业虽然生成了许多大数据源,但其底层的支撑技术却是相同的。而且,不同行业还可以使用相同的大数据源。大数据并非只有单一的用途,它的影响将会非常深远。
我们将要讨论以下几种大数据源。
汽车保险业:车载信息服务数据的价值。
多个行业:文本数据的价值。
多个行业:时间数据与位置数据的价值。
零售制造业:RFID 数据的价值。
电力行业:智能电网数据的价值。
博彩业:筹码跟踪数据的价值。
工业发动机和设备:传感器数据的价值。
视频游戏:遥测数据的价值。
电信业与其他行业:社交网络数据的价值。
汽车保险业:车载信息服务数据的价值
车载信息服务在汽车保险行业中的关注度非常高。车载信息服务是通过汽车内置的传感器和黑盒来收集和掌握车辆的相关信息。我们可以配置不同的方案,使用黑盒来监测所有的汽车数据。我们可以监测车速、行驶里程,以及汽车是否安装了紧急制动系统。车载信息服务数据能够帮助保险公司更好地理解客户的风险等级,并设置合理的保险费率。如果彻底地忽略隐私问题,车载信息服务装置可以跟踪到汽车去过的所有地点、何时到达的、以多快的速度、使用了汽车的哪些功能等。
车载信息服务可以潜在地降低司机的保险费率,并提升保险公司的收益。它是怎样做到在降低费率的同时提升收益呢?答案就在于保险公司要根据风险评估来进行保险定价。传统的风险评估方法使用的是年龄、人口统计特征以及个人意外伤害历史这类数据,它们只能提供高层次的概要信息。对于驾驶记录没有任何问题的车主,传统方法根本没办法把他们和附近的其他人区分开。
保险公司要未雨绸缪,并做好最坏的打算。它们要弄清楚哪些人放在哪个风险范围上是最安全的,一般情况下,它们会先假定这些人的风险是位于该风险范围较高的一端。汽车保险公司对车主的行为习惯和实际风险了解得越详细,风险范围就会越窄,同时认定范围内出现需要提升费率的最坏情况的可能性就会比较小。这就是为什么可以同时降低保险费率和提升收益的原因。如果保险公司认为投保个体的风险较好,那么保险公司将可以更好地了解每个人的风险状况,预计必须支出的保费就不会发生太大变化。
全球很多国家的保险公司都在使用车载信息服务,而且数量越来越多。早期项目的注意力放在从汽车上收集最少的信息,例如,它们并不关心汽车去过什么地方。早期项目跟踪的是汽车开了多远、什么时候开的车、是否超速和是否使用了大量的紧急制动。这些信息都是非常基本的信息,不牵涉到个人隐私,是故意设计成这样的。因为避免了收集高度敏感的信息,所以才会被广泛地接受。这个道理也同样适用于商业车队。如果保险公司了解到公司车队更多的用车情况,那么它为公司车队确定保险费率也就更容易。
车载信息服务数据最初是作为一种工具出现的,它可以帮助车主和公司获得更好的、更有效的车辆保险。再过一段时间,等到许多交通工具都安装了车载信息服务装置后,那时保险业以外的行业也可以使用车载信息服务数据了。现在,公共汽车已经有了车载计算机管理系统,但是车载信息服务设备可以将其提升到一个新的层次。车载信息服务数据还有一些有趣的应用,我们来看一下这些应用。
使用车载信息服务数据
如果车载信息服务真的开始大规模应用,一定会出现许多令人兴奋的分析应用。想象一下,以后全国有数以千万计的汽车都安装了车载信息服务装置,那时候第三方研究公司会以匿名的方式为客户收集非常详细的车载通信数据。与为保险收集的有限数据不同,这时数据收集是以分钟或秒为频率,且收集内容包括但不限于速度、位置、方向和其他有用的信息。
无论交通是否阻塞,无论什么日期,这种数据反馈方式都会提供大量的车载通信信息。研究人员可以知道每辆车在道路上的行驶速度,他们还可以知道车流开始的时间、结束的时间,以及持续的时间。这种真实的交通流信息视图将会多么令人惊讶!试想这会对交通阻塞和道路系统规划的研究产生多么大的影响!
无心插柳柳成阴
车载信息服务数据的多种用途只是一个例子,它说明了可以用最初预见不到的方式来使用大数据。对于某种特定的数据源,我们最后发现它最有效的用途可能与其创建之初的用途大相径庭。面对我们碰到的每一类大数据源,我们要开拓思路,多想想常规之外的其他用途。
如果研究人员能够掌握大量汽车在每一个高峰时段、每一天、每个城市中的动向,他们就能非常清晰地判断出车流产生的前因后果。此外,还能查明下述问题的答案。
一个在路中央的轮胎会对交通产生什么影响?
左侧车道堵车会发生什么?
如果路口的交通灯不同步,会产生何种结果?
哪些十字路口虽然按照预期设定方式工作,但通行时间的设计仍然不合理?
如果某条道路堵塞,堵塞会以多快的速度蔓延到其他道路?
即使我们集中精力投入到昂贵的测试中,现在要想有效地研究诸如此类的问题也几乎是不可能的。除非我们安排人手来实际地监测每一条道路,记录下所有的信息,只有这样我们才能解决交通堵塞的问题。或者,我们可以安装大量的传感器来监测过往的车辆,还可以安装视频摄像头,但这些选择因为成本问题被严重限制了推广。
交通道路工程师做梦都想得到我们所讲的车载通信信息。如果车载通信装置变得随处可见,那任何交通拥堵的地方都能被发现。城市道路和交通管理系统的革新,以及城市道路建设规划,都将惠及普通大众。车载通信刚开始出现时是为了满足保险定价的需求,但有了它还可以缓解交通压力和驾驶员堵车时焦急等待的心情,它的存在终将使高速公路的管理模式发生革命性的改变。
多个行业:文本数据的价值
文本是最大的也是最常见的大数据源之一。想想我们周围有多少文本信息的存在,电子邮件、短信、微博、社交媒体网站的帖子、即时通信、实时会议以及可以转换成文本的录音信息。文本数据是现在结构化程度最低的,也是最大的大数据源。幸运的是,我们在驾驭文本数据、利用文本数据来更好地做商业决策方面已经做了很多工作。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数据分析、业务监控、运营复盘等场景中,列值趋势计算是核心需求之一。无论是分析销售额的月度增长、用户活跃的变化趋势、库存 ...
2026-06-12在数字经济深度渗透的当下,消费者的购买行为已从过去的 “被动接受” 转变为 “主动决策”。流量红利消退、获客成本攀升、用户 ...
2026-06-12CDA三级认证是三个级别中的塔尖,全面考察数据战略、团队领导和复杂项目的综合能力。它所对应的《敏捷数据挖掘》教材,不再局限 ...
2026-06-12在游戏产业的商业逻辑中,付费玩家是支撑游戏生存与发展的核心支柱。行业普遍遵循 “二八定律”:20% 的付费玩家贡献了游戏 80% ...
2026-06-11【核心关键词】企业、定位、传统、产品、互联网、可视化、业务侧、数字化、结构化、数据分析、传统制造业、市场状态、发展空间 ...
2026-06-11 解读《CDA二级教材:量化策略分析(2025)》的全景结构与学习逻辑 ” CDA二级认证是企业招聘数据分析师时最常提及的证书门槛 ...
2026-06-11【核心关键词】药企、可视化、营销、分类、数据分析师、销售数据、业务人员、指导方向、分析报告、营销数据、营销医生 【专访摘 ...
2026-06-10在统计学分析、问卷调研、实验验证、业务复盘等场景中,卡方检验与 T 检验是应用最广泛的两类基础假设检验方法。前者专门处理分 ...
2026-06-10 很多数据分析师每天都在计算指标、制作报表,但当被问到“什么叫指标数据元”“指标数据标准包含哪些核心维度”“指标数据质 ...
2026-06-10在MySQL数据库日常查询、数据统计、后台接口开发、数据导出等场景中,开发者经常需要查询数据表除某几列之外的所有字段。例如查 ...
2026-06-09在Python网络请求、爬虫开发、接口测试、数据抓取等实操场景中,requests库是最常用的第三方请求工具,而content属性是requests ...
2026-06-09 数据分析正在重塑每一个行业。CDA认证的三本官方教材,分别对应Level I、Level II、Level III,为你铺就从业务数据分析到数 ...
2026-06-09在数字财务、智慧财税、业财融合深度推进的当下,传统财务模式下数据标准混乱、业务流程碎片化、知识无法沉淀、系统互通性差等问 ...
2026-06-08随着数字经济深度渗透各行各业,数据正式成为继土地、劳动力、资本、技术之后的第五大生产要素,是企业数字化转型、精细化运营、 ...
2026-06-08 很多数据分析师能熟练写SQL、做透视表,但当被问到“数据是从哪里来的?经过哪些加工才进入数据仓库?ETL具体做了什么?”时 ...
2026-06-08【核心关键词】贷款、报表、课程、专业、建模、缺失值、营销、互联网、银行、办公自动化、数据分析、数据预处理、特征工程、贷 ...
2026-06-05在数据库数据查询、业务报表统计、多表关联分析中,LEFT JOIN左连接是使用率最高的SQL关联查询语句。其核心特性是保留左表全部数 ...
2026-06-05 很多数据分析师能熟练地写SQL、做透视表、算描述性统计,但当被问到“如何预测用户流失概率”“如何归因销量下滑的关键因素 ...
2026-06-05任何一款产品从诞生、普及到最终退出市场,都会遵循一套固定的发展规律,这就是产品生命周期理论。在市场竞争日益激烈、产品迭代 ...
2026-06-04在Excel数据分析、办公统计、业务报表制作场景中,数据透视表是数据汇总、分类统计、快速复盘的核心工具,能够高效完成海量原始 ...
2026-06-04