
保险业在大数据领域的应用
互联网的发展使得大数据引起人们广泛关注。现如今大数据技术早已渗透到金融、通讯等行业以及生物学、物理学等领域。大数据在容量、多样性和高增速方面的爆炸式增长全面考验着现代企业的数据处理和分析能力,与此同时也为各个行业带来了准确洞察市场行为的机会。迄今为止大数据技术与产品有哪些创新,工业大数据应用面临哪些挑战,金融行业大数据应用现状如何等。围绕这一系列问题,4月27日至28日,由工业和信息化部指导、中国信息通信研究院主办的"2016大数据产业峰会"在北京国际会议中心盛大召开。28日上午大数据推动金融创新分论坛中国保险信息技术管理有限责任公司战略规划部总经理助理 李隆春做了精采演讲。
保险行业本身就是基于数据的行业,保险行业的整个基础是大数定义,同类业务发生的风险测算出一个概率,基于这个概率进行相应产品的设计,给产品的风险进行定价,整个保险行业真的是基于数据而且是离不开数据的。保险行业的大数据的应用可以从两方面来看,一是保险业在利用大数据技术在各个业务环节进行的各的工作,比如我们在产品开发领域、营销领域、承保理赔、防灾防损都有相关的应用。比如在产品开发领域,举个例子来说,如果得了糖尿病,保险公司不会给你承保,有了大数据技术之后,对糖尿病人保险公司也可以承保,糖尿病的截肢风险,重度患者会担心截肢,保险公司推出和健康管理相结合的,戴上保险公司提供的运动手环或者其他监测工具,每天把你的运动信息、饮食信息上传到保险公司的网站上,它可以保证你将来如果截肢会给你赔一大笔钱,按照他的健康管理计划和饮食计划你不会有截肢的风险。
产品优化和客户的营销,泰康公司已经在做基于客户的语音分析结构的精准化营销工作。在防灾防损的领域,结合GPS技术,对过去难以监控的船舶风险进行相应的监控。特别是大海里航行的轮船,经常会有遇到风暴和遇到海盗的问题,货物遭受了损失,这时候通过GPS技术对轮船航行路线的全程监控,可以知道你到底去了什么地方,申报的损失发生的地方是不是海盗经常出没的地方,是不是有风暴和雷雨天气。通过这样一些监控来防止恶意欺诈的行为。
欺诈领域,保险行业的欺诈类案件也是频发的,按照国际保险的统计,全球有10%到20%的理赔都是因为欺诈。按照这样的比例计算,中国每年有600亿的金额都被欺诈走了,通过大数据技术可以提高防欺诈的能力,后面会有一个例子。
保险在大数据领域目前还是外挂式,比起银行的应用还比较落后。美国在财产险方面的大数据应用比较领先,其次是在寿险和健康险领域,国内也做了一些应用,后面会举一些简单的例子。我们在各个环节有典型的例子,大家可以看一下。比如在产品的开发领域,前进保险公司利用信用技术来进行产品的定价,美国社会的信用记录是非常好的,每个人都有征信的评分,评分高的人通常家庭的教育程度比较高,对自身的财产安全和健康的管理水平也比较高,这种人的保险意识比较高,出现风险的概率也会比较低,通常会给这种人比较低的保费定价。在市场营销领域,有一个Facebook预测健康的情况,应杰华(音)这个公司利用Facebook社交领域的数据对投保人群的信息分析,发现如果经常在Facebook发布一些评论,你驾驶本田车吸烟的概率比较低,喜欢看肥皂剧的人的暴力倾向性比较高,通过Facebook社交数据分析可以给这些人群画一个标签,投保的时候可以给你不同的定价。气候(音)保险公司,后来被谷歌收购了,这个公司主要是做农业保险的数据。美国跟中国一样,有一部分保险是政府补贴,但是政府补贴这部分是比较有限的,真的发生自然灾害的话,投的保政府补贴的弥补是非常少的,气候保险公司针对这部分灾情做了一些大量的产品开发,利用大量的土壤监测数据进行实时的监控。气候保险公司在美国有10多万亿的气候数据和2000多个土壤监测的数据,每天实时监测的50T的数据量,可以给农民提供农业耕作的方案和未来气候的信息,帮助美国的农民进行更好的耕种,同时减少农业的损失。
国内也有一些案例,众安在线(音)推出了步步保,每天只要走路,走一万步以上可以给你折扣,你的保费就会递减。这是和小米及运动的APP公司进行合作,用户只要把每天走的步数传到网站上,下个月交保费的时候可以自动给你扣减,你走的步数特别多,你的保费甚至可以全部减免。如果经常运动,说明对自己的健康非常重视,你的健康就会得到很好的管理,健康险方面出险的概率就会比较低。国内的泰康保险公司在这方面做了大量的应用,工行的同事刚才提到基于语音的分析,泰康建立了一个语音大数据分析的平台,客户对95522打的电话进行记录和分析,通过分析把这些人做了标签的划分,哪些是商务人士,哪些是学生,哪些是孕妇,哪些是运动员,哪些是老人,不同的人群在销售员展业的时候会有一个**,告诉销售员这个人的标签是什么,可以**什么样的保险产品,基于这样的语音分析结构,结合泰康其他的促销手段,贡献了千万元的保费收入。
美国前进保险公司基于信用的保险定价,美国的信用保障比如有没有破产的记录、信用评分的高低,最终会给你不同的产品定价。基于这样的产品定价的体系,美国前进保险公司在美国的保险行业的理赔率低于同行业,他非常善于利用新的技术来开展他的业务。
这是整个保险业利用大数据方面的经验。大数据技术对整个保险行业来说有可能产生颠覆式的影响。我们这里做了几方面的推测。首先第一变革就是会重塑保险风险,第二定价模式会发生一些变化,第三经营模式会发生一些变化。保险风险的重塑方面,未来的无人驾驶汽车,未来无人驾驶汽车之后,不需要由人来开车,现在发生的刮蹭事故都不会存在,未来出现的风险反而是无人驾驶汽车的技术成熟性的风险,建模模型的稳定性风险,风险转变了。定价模式不一样,大家现在看到车联网技术在大幅的变化,整个保险行业的车的定价跟驾驶的里程数没有关系,这个人开得多和少,不发生事故的情况下都是一样的,根据不同人的驾驶情况设计产品的时候,会跟客户的自身情况相结合,根据你驾驶的行为,根据你每天走的路的情况,情况都不一样。实时的定价,未来会提出保险专家的理念,把一笔钱给一个保险公司,这个保险公司可以依据你的场景,你今天坐火车明天坐飞机,你告诉他你的场景之后,他会实时给你买火车或者飞机的意外险,你马上要登山或者去户外运动,他会给你户外运动的保险,他基于你的场景实时给你买一个保险,把你的十万块钱用完之后,你就可以重新续费,每次的保险都是根据你的场景来的。
保险行业的经营模式依据大数据和互联网技术会发生变化。现在的保险行业本质上是专营化,所有的保险公司都是需要到保监会做审批,必须要取得相应的保险资质才能开展保险。但是随着互联网技术的发展特别是大数据的发展,现在出现了一些新的模式,现在有一个抗癌公社,它已经不再需要保险机构和红十字会等中介机构了,抗癌公社是大家在网上形成互助的团体,现在已经有二三十万人,一旦某个人得癌症了,每个人出一块钱,募集资金来给你治疗癌症。未来不再需要保险公司,大家形成互助团体就可以了。这样的场景都是未来在保险行业里由于新技术的出现会带来的变化。
保险行业非常重视大数据的应用,我们要有数据,同时我们的数据还能用,我们的数据不是越多越好,我们要保证数据的质量真正能给我们产生价值。整个保险行业面临这样的情况下在积极地寻找相应的对策。在这样的背景下,中国保信应运而生,2013年正式成立,成立的背景是各个保险公司在进行承保的时候都会发现不了解这个人在别的保险公司的保险情况,有可能在前一个公司发生了理赔,甚至他有疾病情况需要购买高额的保险,这时候他会到别的公司进行投保,为了促进整个保险行业数据的共享,各个公司之间能知道其他公司的承保理赔情况,在国务院批准下成立了中国保信这个公司。成立公司的时候,前副总理**和后来的**总理、**都签了字,希望这个公司尽快成立,银行行业有银联,保险行业缺少这样的公司。这个公司成立之后,主要工作就是促进整个行业的信息共享,作为行业数据共享保险行业的基础设施存在。
主要做这几方面工作,围绕着保监会和外部管理的各部委开展信息共享平台的建设。我们有车险平台、农险平台、健康险平台、中介和资产查询平台。车险平台在保信成立之前就已经成立了,大家大部分都会买车险,你在平安人保买的车险价格相差不是特别大,主要原因是你的出保记录存在保信这个公司里,保信会根据你过往的出保次数给保险公司一个系数,这个系数在保信的平台里计算。基于这样的服务,今年在平安承保,明年在人保承保,信息不共享的问题得到了解决。目前我们已经做了**补贴的种植险数据,今年准备开展全部农业保险的数据收集。反欺诈的系统,工行的同事提到大数据很多利用在反欺诈里,车险这个领域做了大量的反欺诈工作帮助保险公司,去年帮公安部找了200多万条的疑似欺诈的线索,和身份证数据中心库进行了对接,找那些已经死亡的人,把死亡的信息和现在的理赔信息进行对比,发现现在有70多个人都是已经死亡了还在继续投保,这样可以帮助保险公司追偿。目前登记的数据有几方面,全流程的登记,从前端的承保到保全到理赔到服务全过程的数据登记。通过登记的信息可以看出数据量非常大,有好几个T的保证信息。
我们在公司内部把所有的保单信息汇总过来之后做了一个归并,按照各种维度进行相应的统计分析,比如按照客户维度、标的维度、险种维度进行归并,为各个机构进行相应的服务,比如风险预测保障基金,一个公司一旦破产之后需要救助多少人,这些数据都借助这个平台进行相应的统计分析。从消费者的维度看各个省市买保险的人有多少,有多少人承保了,有多少人买了多少保险。整个保险公司的服务的评价,配合基金进行保险保障和赔付的比例。除此之外,我们还提供征信和行业的精算报告等等。这是未来在征信行业准备做的工作,把消费者和相关的机构的疑似失信行为都整理出来,在展业的时候给保险公司相应的服务。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
DSGE 模型中的 Et:理性预期算子的内涵、作用与应用解析 动态随机一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明确:TIF 中的地名有哪两种存在形式? 在开始提取前,需先判断 TIF 文件的类型 —— ...
2025-09-17CDA 数据分析师:解锁表结构数据特征价值的专业核心 表结构数据(以 “行 - 列” 规范存储的结构化数据,如数据库表、Excel 表、 ...
2025-09-17Excel 导入数据含缺失值?详解 dropna 函数的功能与实战应用 在用 Python(如 pandas 库)处理 Excel 数据时,“缺失值” 是高频 ...
2025-09-16深入解析卡方检验与 t 检验:差异、适用场景与实践应用 在数据分析与统计学领域,假设检验是验证研究假设、判断数据差异是否 “ ...
2025-09-16CDA 数据分析师:掌控表格结构数据全功能周期的专业操盘手 表格结构数据(以 “行 - 列” 存储的结构化数据,如 Excel 表、数据 ...
2025-09-16MySQL 执行计划中 rows 数量的准确性解析:原理、影响因素与优化 在 MySQL SQL 调优中,EXPLAIN执行计划是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 对象的 text 与 content:区别、场景与实践指南 在 Python 进行 HTTP 网络请求开发时(如使用requests ...
2025-09-15CDA 数据分析师:激活表格结构数据价值的核心操盘手 表格结构数据(如 Excel 表格、数据库表)是企业最基础、最核心的数据形态 ...
2025-09-15Python HTTP 请求工具对比:urllib.request 与 requests 的核心差异与选择指南 在 Python 处理 HTTP 请求(如接口调用、数据爬取 ...
2025-09-12解决 pd.read_csv 读取长浮点数据的科学计数法问题 为帮助 Python 数据从业者解决pd.read_csv读取长浮点数据时的科学计数法问题 ...
2025-09-12CDA 数据分析师:业务数据分析步骤的落地者与价值优化者 业务数据分析是企业解决日常运营问题、提升执行效率的核心手段,其价值 ...
2025-09-12用 SQL 验证业务逻辑:从规则拆解到数据把关的实战指南 在业务系统落地过程中,“业务逻辑” 是连接 “需求设计” 与 “用户体验 ...
2025-09-11塔吉特百货孕妇营销案例:数据驱动下的精准零售革命与启示 在零售行业 “流量红利见顶” 的当下,精准营销成为企业突围的核心方 ...
2025-09-11CDA 数据分析师与战略 / 业务数据分析:概念辨析与协同价值 在数据驱动决策的体系中,“战略数据分析”“业务数据分析” 是企业 ...
2025-09-11Excel 数据聚类分析:从操作实践到业务价值挖掘 在数据分析场景中,聚类分析作为 “无监督分组” 的核心工具,能从杂乱数据中挖 ...
2025-09-10统计模型的核心目的:从数据解读到决策支撑的价值导向 统计模型作为数据分析的核心工具,并非简单的 “公式堆砌”,而是围绕特定 ...
2025-09-10CDA 数据分析师:商业数据分析实践的落地者与价值创造者 商业数据分析的价值,最终要在 “实践” 中体现 —— 脱离业务场景的分 ...
2025-09-10机器学习解决实际问题的核心关键:从业务到落地的全流程解析 在人工智能技术落地的浪潮中,机器学习作为核心工具,已广泛应用于 ...
2025-09-09SPSS 编码状态区域中 Unicode 的功能与价值解析 在 SPSS(Statistical Product and Service Solutions,统计产品与服务解决方案 ...
2025-09-09