
浅谈车企如何点燃大数据
随着汽车市场逐步饱和,竞争加剧,车企希望通过拥抱大数据实现精细化经营,领先一步。但是大数据化的过程却并非一蹴而就,也不是简单大数据技术选择,更应该看成一个企业级系统工程,本文结合大数据项目实践和行业理解,着重阐述了如何系统看待大数据建设和关键问题解决思路
背景
随着汽车普及不断深入,中国汽车市场逐渐饱和,增速放缓,迈入竞争运营阶段到。根据有关报告,2015年,占我国汽车产量98%的37家主要汽车企业形成整车产能3122万辆。其中乘用车产能2575万辆,产能利用率为81%;商用车产能547万辆,产能利用率仅为52%。同时随着近年大数据兴起,越来越多的车企也选择投身大数据潮流,希望通过拥抱大数据,提供更加精细化的业务运营,营销模式变化,乃至企业转型,提供自己运营竞争力。如国际顶级车企大众、宝马、奔驰、还是国内企业长城、吉利等都纷纷开启了自己大数据之路(图1)。
图1 车企大数据典型案例
然而在大数据化过程中,车企却会发现过程并不是那么一帆风顺,在和车企交流中,往往能听到业务部门的抱怨:
数据质量怎么这么差,用户姓名一看就是随便输入的,手机号码居然只有9位
销量统计错了,把提车数统计到了实销数里了
你做的分析功能我们不需要,对了我们库存预测到底能不能做
…….
信息化部门却会觉得感觉到困惑
我们已经采用先进的大数据技术平台了,但是做些什么业务呢
我们哪里知道业务部门对应计算口径是什么,业务需求不清楚
你这个业务需求,我们没数。。。。
………..
由此如何构建一个高效大数据平台,这不仅仅是简单IT系统建设,更不是简单购买了大数据平台就是实现大数据分析。企业大数据化更应该是一个系统,而是贯穿了管理-业务-系统-数据,逐步规划,逐步建设,而不是一蹴而就。因此基于大数据思考、实践模式,联想总结出企业大数据建设框架(图2),针对其中关键问题提出思考和分析
图2.企业大数据建设框架
大数据之“本”:多源之水,夯实数据仓库
对于成熟的车企要利用大数据产生价值,必然需要构建丰富的数据体系才 能发挥出大数据平台价值,否则将成为无源之水,无本之木。对于车企而言,通常需要围绕四个主要要素构建数据源才能满足整体业务需求:主机厂、渠道、客户、车。
那么车企的有哪些数据呢?通常大部分车企数据传统来源已经有了相对成熟生产系统体系,包括销售领域的分销商管理系统(DMS),经销商使用的CRM、客服中心(Call center)、生产管理系统,质量管理系统(QIS)等等,因此可以满足日常主机厂自身日常运营分析、产品分析以及对渠道运营分析,但是相比,仍然存在如下问题:
客户数据匮乏,相比电信、金融行业,车企行业客户触点过少,而是周期过长,无法构建多维的客户数据
产品质量数据往往通过售后服务反馈,进行被动故障分析排查,难度较高,无法缺少过程数据进行,更无法做到预测性故障分析;
客户信息传播行为发生变化,更多进行网络信息传播,因此通过传统销售系统、售后系统、客服系统相对被动无法满足快速获取信息的需求
因此为了发挥大数据的价值,就需要增加新的数据源,满足业务分析对数据多样化、化的需求
1)车联网系统:
目前越来越多的主机厂考虑部署或者已经部署车联网系统,从大数据角度来说,通过车联网系统有效补充用户日常数据缺失,以ADAS系统为例,可以捕获如下数据:
用户驾驶行为数据:用户每次驾驶里程,转向习惯,行驶速度、是否有疲劳驾驶等,可以有效帮助客户画像数据构建
产品参数实时获取:不同零部件的关键运营指标,如转速、温度、电子指标等,从而为精细化产品质量预测和分析提供了基础
2) 网络舆情信息:
网络已经是用户信息传播的主要渠道,相比主机厂传统方式,网络信息会更早、更全面反映用户对主机厂的相关信息,通过部署自有网络爬虫系统或者购买第三方的SAAS服务,可以针对重点门户、知名行业网站、论坛、电商平台等
通过爬虫系统可以捕获网络新闻、论坛帖子、用户评论等网络信息
基于大数据技术处理,通过网络信息进行市场营销、品牌影响力、用户习惯、产品质量等分析,以品牌为例,可以完成品牌日常热度、口碑倾向等分析。
3) 第三方外部数据
行业性数据:通过乘联会等行业组织的数据引入,可以有效解决市场趋势分析的数据引入;
第三方用户标签数据:和第三方数据合作中,车企往往希望能得到用户级的数据交换,考虑到第三方数据匹配成功率不足的问题,这就需要车企构建:统一的用户标签体系和用户多ID体系;此外更为可行的做法是充分利用第三方的做好用户画像分析数据,优先完善用户群统计数据;
大数据之“智”:以终为始,业务驱动数据价值
业务需求驱动大数据方向,大数据的价值通过业务呈现。对于车企而言,大数据分析可以有效提供运营体系关键领域效率,主要包括三个方向(图3):商业敏捷运营,产品精准设计和制造领域智能化
图3 车企大数据应用方向
那么面对不同业务场景,大数据分析如何展现自身作用,根据德勤咨询的大数据分析不同类型统计研究,可以看出在当前大数据应用下依次从三个层面进阶:统计分析、根因分析和预测性分析(图4)
统计应用分析作为基础分析能力,不仅仅为高级分析提供了数据基础,同时在业务层面覆盖面更广泛,而预测性分析则充分体现了大数据智能化能力,提供了业务精细化决策的手段。无论哪种分析能力其实都是业务需要的,关键在于如何和业务场景匹配。
图4 不同大数据分析类型
以汽车售后环节的在保车辆理赔业务为例:在保车辆理赔是车企售后服务重要业务,对于出现配件故障在保车辆,车企需要支付相应的维修工时、配件费用等等,每个月车企花费的理赔费用通常都在几百万,乃至千万级别。
因此基于理赔业务理解,针对理赔业务关键场景,联想构建了大数据业务设计(图5)
图5 在保理赔分析
1) 理赔视图:
对于车企需要能够监控整体理赔指标,及时发现整体理赔变化状况,从而及时采取应对策略。这就要求能够对理赔业务提供全局洞察,同时能够及时发现变化,通过理赔地图设计可以很好满足业务快速的洞察
对于理赔地图主要解决了统计分析和数据可视化的需求,重点需要实现如下功能:
定义出理赔业务的KPI体系:通常为理赔金额、单次理赔金额、理赔- – 对于理赔KPI各项指标提供趋势变化统计分析旧件数、理赔台次等,对于环比、同比等异动能够明确标识
提供地域下钻功能,从而实现业务不同层次探查;
提供地域、车型分布统计占比分析
2) 理赔诊断树
理赔业务不仅仅是售后服务,同时也为产品品质分析提供了基础,在整车中通常有几百件关键配件,如何快速发现那些旧件产生了理赔金额,这些旧件是否因为批次原因,还是因为超过一定里程原因?
通过围绕旧件种类、旧件类型、旧件批次、旧件使用里程等旧件特征构建出理赔旧件的分析结构树,可以用于分析理赔金额、件数进行分层结构探查,也就针对理赔同比或者环比剧烈变化时,进行异动探查,快速定位到导致异动的旧件因子。
3) 异常理赔预警
在保理赔中存在服务店,骗取配件、维修费用事件,过去由于,因此车企没有很好手段进行异常理赔的分析,只能通过服务店整体理赔数量和金额进行判断,随着车联网系统开始进入车辆预装,为异常理赔预测提供可能性。
通过已有故障配件和无故障配件的里程、行驶行为、受力、温度、湿度、电磁等环境参数采集,构建出配件故障概率模型,针对理赔配件通过历史数据回溯,计算出配件故障概率,从而作为是否异常理赔判断参考。
大数据之“准”:以规矩制方圆,构建数据管控体系
国内车企相对来信息化还没有进入精细化阶段,因此数据质量往往不高。以笔者参与的国内某车企大数据项目为例,就遇到如下情况
1) 业务系统缺少数据约束:经销商管理系统录入的用户身份证号码没有基本校验,用户手机号位数不全等;
2) 业务部门业务口径混乱:词汇定义随意,出现不同部门对同一个业务术语不同解释;车企使用术语和行业通用术语不一致;业务口径没有明确定义等;
结果调研了十多个业务部门,竟然有90%部门第一个意见就是数据质量差,无法进行有效用户分析,系统使用率和使用效率大打折扣。究其根源,就是企业没有建立数据管控体系,尤其以数据标准体系缺失为首要原因。
“没有规矩不成方圆”,只有数据标准体系的建立,才能够确立数据质量管理基础。构建数据标准体系需要包括三方面内容:
1) 数据标准体系
数据标准体系(图5)需要包含两层设计:
数据体系结构:数据体系结构设计应该和业务紧密相关,采用分层设计
数据的标准定义:需要数据来源、数据属性、业务定义、数据格式、数据宿主等关键信息
图6数据标准样例
2) 数据标准管理组织
数据标准体系结构随着业务的演进不断优化,而每个数据则必须找到唯一管理者,才能保证数据的唯一性解释,因此数据标准管理组织包括了两个关键角色:
数据标准体系规划团队:负责数据标准体系设计和优化,通常可以由信息化部门牵头。
数据owner:作为数据的拥有者,负责数据名称定义、业务口径、数据变更申请等工作,通常建议由业务部门负责;
3) 数据标准管理流程
大数据就像流动的水一样具有生命,不断流动,因此就需要围绕数据生命周期:建立-变更-退出建立数据管理流程
建立:重点确定数据拥有者,使用者以及业务定义
变更:重点说明变更申请原因,变更的内容、变更对其他数据影响;
退出:重点确定退出原因,对其他数据影响;
结束语
越来越多车企会重视大数据对运营带来的价值,构建自己的大数据平台。那么要想能够让大数据平台高效运作,这不仅仅单纯涉及到大数据技术方案,而是系统性工程,因此选择具有端到端的大数据解决方案能力的供应商将使车企的大数据之路事半功倍。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
Python HTTP 请求工具对比:urllib.request 与 requests 的核心差异与选择指南 在 Python 处理 HTTP 请求(如接口调用、数据爬取 ...
2025-09-12解决 pd.read_csv 读取长浮点数据的科学计数法问题 为帮助 Python 数据从业者解决pd.read_csv读取长浮点数据时的科学计数法问题 ...
2025-09-12CDA 数据分析师:业务数据分析步骤的落地者与价值优化者 业务数据分析是企业解决日常运营问题、提升执行效率的核心手段,其价值 ...
2025-09-12用 SQL 验证业务逻辑:从规则拆解到数据把关的实战指南 在业务系统落地过程中,“业务逻辑” 是连接 “需求设计” 与 “用户体验 ...
2025-09-11塔吉特百货孕妇营销案例:数据驱动下的精准零售革命与启示 在零售行业 “流量红利见顶” 的当下,精准营销成为企业突围的核心方 ...
2025-09-11CDA 数据分析师与战略 / 业务数据分析:概念辨析与协同价值 在数据驱动决策的体系中,“战略数据分析”“业务数据分析” 是企业 ...
2025-09-11Excel 数据聚类分析:从操作实践到业务价值挖掘 在数据分析场景中,聚类分析作为 “无监督分组” 的核心工具,能从杂乱数据中挖 ...
2025-09-10统计模型的核心目的:从数据解读到决策支撑的价值导向 统计模型作为数据分析的核心工具,并非简单的 “公式堆砌”,而是围绕特定 ...
2025-09-10CDA 数据分析师:商业数据分析实践的落地者与价值创造者 商业数据分析的价值,最终要在 “实践” 中体现 —— 脱离业务场景的分 ...
2025-09-10机器学习解决实际问题的核心关键:从业务到落地的全流程解析 在人工智能技术落地的浪潮中,机器学习作为核心工具,已广泛应用于 ...
2025-09-09SPSS 编码状态区域中 Unicode 的功能与价值解析 在 SPSS(Statistical Product and Service Solutions,统计产品与服务解决方案 ...
2025-09-09CDA 数据分析师:驾驭商业数据分析流程的核心力量 在商业决策从 “经验驱动” 向 “数据驱动” 转型的过程中,商业数据分析总体 ...
2025-09-09R 语言:数据科学与科研领域的核心工具及优势解析 一、引言 在数据驱动决策的时代,无论是科研人员验证实验假设(如前文中的 T ...
2025-09-08T 检验在假设检验中的应用与实践 一、引言 在科研数据分析、医学实验验证、经济指标对比等领域,常常需要判断 “样本间的差异是 ...
2025-09-08在商业竞争日益激烈的当下,“用数据说话” 已从企业的 “加分项” 变为 “生存必需”。然而,零散的数据分析无法持续为业务赋能 ...
2025-09-08随机森林算法的核心特点:原理、优势与应用解析 在机器学习领域,随机森林(Random Forest)作为集成学习(Ensemble Learning) ...
2025-09-05Excel 区域名定义:从基础到进阶的高效应用指南 在 Excel 数据处理中,频繁引用单元格区域(如A2:A100、B3:D20)不仅容易出错, ...
2025-09-05CDA 数据分析师:以六大分析方法构建数据驱动业务的核心能力 在数据驱动决策成为企业共识的当下,CDA(Certified Data Analyst) ...
2025-09-05SQL 日期截取:从基础方法到业务实战的全维度解析 在数据处理与业务分析中,日期数据是连接 “业务行为” 与 “时间维度” 的核 ...
2025-09-04在卷积神经网络(CNN)的发展历程中,解决 “梯度消失”“特征复用不足”“模型参数冗余” 一直是核心命题。2017 年提出的密集连 ...
2025-09-04