京公网安备 11010802034615号
经营许可证编号:京B2-20210330
我们知道,世界上唯一不变的就是变化本身,因此变革管理是商业永恒的话题。
变革管理的两个重要工具便是数据资产管理和精益流程管理。
前者使得机构“知炎凉,知利害“,后者使得机构明白自身特点,做到上令下达,这里我们只说前者。“知炎凉“是一个下情上传的过程,从业务数据采集到数据挖掘模型实现洞察,为组织的决策机构提供制定策略的依据。比如在根据客户提供的信息预测出如果赊销或授予贷款后违约的可能性。”知利害“是组织中各级管理者分析决策过程,经常需要结合各种报表和可视化工具进行决策支持。报表体系是对最终经营指标的逐级拆分,比如著名的杜邦财务分析体系,将制造业企业的资产收益率这个最终企业价值衡量指标拆解为由收入、成本和周转率组成的业务部门可操纵的KPI指标。又比如,在信贷业务中,将产品利润率拆分为贷款利率、获客成本率、审批通过率、不良率等。最低层次的指标,比如不良率指标,可以通过上面提到的数据挖掘模型对每个申请者未来的不良率进行预测。
策略制定者根据每个潜在贷款用户的不良率的预测值,以产品总的利润率最大化为目标,对申请者进行取舍。说到这里,读者就明白了数据人的两个基本工作,那就是制作汇报报表和建立数据挖掘模型。如下图所示,左侧的任务是对接各数据源,根据业务部门认可的标准,核定数据质量和含义,根据计算方法制作报表,供决策人员使用;右侧的任务是对每个用户、产品和渠道打标签,在业务主题之下建立算法模型并根据每个个体的预测值过滤名单,并在决策引擎中配置相应的业务执行策略,实现信贷审批或精准营销自动化,最后还有评价阈值选取和策略的执行效果,作为下一步优化的依据。
以上说的应用点比较抽象,下面列举一下数据挖掘的常见业务场景。
客户智能主要是基于对客户的洞察,以实现客户全生命周期价值提升为目的的分析场景。比如在初次获客时识别高价值客户,并进行重点营销,提高单客价值。这里的风险智能指的是狭义的信贷风险,主要是指授信业务前识别出申请者的还款意愿、还款能力和真实意图,降低违约成本。财务智能则是关注机构资金的运行效率和流动性安全,需要对宏观和行业指标进行精确预测,合理分配资金资源,降低无效配置成本。运营智能可以识别并发现不合理事件,降低操作风险的成本。
数据资产在为企业提供价值的时候,会遇到很多问题,主要表现为以下三点:
1)部门各自为政,数据反复清洗加工、分析工具重复采购、挖掘成果小范围使用、先进经验未能共享;
2)数据割裂:管理条线间数据割裂、数据来源间未能打通、数据脱敏后丧失价值,比如我们在做洗钱交易识别时发现交易对手的唯一标示全部是星号,这就是选取了错误的脱敏方式导致的不可恢复的错误后果;
3)缺乏系统性管理:缺乏全面的围绕客户、风险、运营、财务等全面规划分析场景,执行过程随意,流程体系不健全,保障不到位,数据和模型资产流失严重。
数据治理便是为数据资产保值增值而服务的。
其目标是消除歧义、减少数据孤岛,降低数据使用成本,提高对业务的响应,提高对数据隐私安全保护。
实施数据治理可以为数据管理提供可信任的数据,减少数据重复,增强业务和IT对于数据的信心,改善数据的及时性和可用性,建立通用的数据词汇表,以确保访问正确的信息,定义企业范围(或站点/项目范围)的值以获取公共参考数据,提供信息和指导,以协助有关数据的合规性和监管工作。
过去提到数据治理,更多的被认为是IT部门的事,其实不是这样的。就拿数据质量举例吧,数据来自业务,它产生于业务,获取自业务系统,数据质量标准也是业务部门订的,数据人只是帮业务人员落地质量检验,但是数据有质量问题,是不能直接解决的。业务部门如果不太关心数据质量,比如说最近金融监管部门对洗钱行为监管更严格了,很多银行希望买套系统或者寄希望于AI算法识别洗钱行为,但是很多金融机构对最基本客户信息还不了解,连客户基本的联系方式和地址都存在大量缺失,这很难保证客户的真实性。
举个例子,一间屋里注册了六家公司,这些公司肯定是空壳公司。数据质量如果由IT负责很难满足要求,因为业务人员办理业务的时候根本不去核实这个地址的真实性,地址写不写他都不太关心。把数据质量提升的工作压到IT人员根本解决不了问题。
数据治理在国外自上世纪80年代应企业自身数据资产管理诉求而内生发展起来。我们企业最早于2003年提出数据治理概念,之后银行业应监管要求,自2005年逐步加强对数据治理的重视和投资力度。取得了丰硕的成果,但是往往带有“运动”的特征。一提到数据治理,更多的是关注自顶向下的制度设计,而忽视自底向上业务的驱动。很多时候是IT闭门造车,还提出基于IT架构的数据治理。
感觉这很专业啊,但是我举个例子,比如我今天想吃饭了,得看看家里有什么菜,至于符不符合口味不知道,有什么就吃什么。
这是基于IT架构的数据治理,只管盘点现有系统和现有数据。这个方法确实有其用处,但是不应该作为数据治理的主导。因此,以往的数据治理经常出现有数据治理组织架构,却无合适的人到岗;有数据标准等规章制度,而在新旧系统上无法落地。
因此,ThoughtWorks数据智能事业部呼吁国内企业回到价值导向的数据治理的初心,提出精益数据治理,不仅从上至下,并且自底向上,围绕业务场景,以价值驱动数据治理的具体体现。
精益数据治理讲求价值驱动,围绕场景,减少浪费,持续改进。体现为以下五个特点:
1)从业务愿景出发识别价值,在适当的时间为内部客户提供价值是精益数据治理的关键要求,通过对齐业务战略和目标来识别有价值的数据利用场景。
2)构建价值流,识别出场景后,在源数据和场景之间建立价值流,价值流是将产品或服务带给用户所需的资源和信息流,需要构建和改进价值流,避免浪费。
3)使价值从源头流向用户,“流”使价值能够以经过最少的阶段和活动便能交付,无缝流是精益数据治理的关键要求。减少浪费是精益数据治理的重要策略,我们发现,所有的数据质量的问题,都能够与精益思想的7种浪费一一对应起来,解决了数据生产的浪费问题,就大部分解决了数据质量问题。
4)拉动价值流,只有在内部客户有需求时,流程才能运行,此阶段强调仅在有需求时才需要响应。
5)不断迭代,精益求精,持续改进以追求完善,实现可持续变革。
ThoughtWorks数据智能事业部根据多年辅导企业数字化转型的实践,推出价值导向的数据治理实施路径。其有三点异于传统数据治理实施路径:
1)以数据探查代替需求访谈。
精益数据治理是以在数据应用为纲,但是在数据治理初期,企业管理人员对数据应用的价值认识是模糊的,有些只是一些想法,往往难以指导数据应用规划的制定。因此我们借用敏捷开发的工具,创造出精益数据探索工作坊,帮助企业构建数据驱动的创新战略,发现数据创新场景,验证和制定数据应用创新计划;
2)IT部门数据中台敏捷开发。
以往数据治理往往分为咨询、落地等多个阶段,并且把数据标准落地、质量监控这些重要任务留给甲方自行完成。根据我们的观察,数据标准落地部门往往缺乏新IT系统上线评审的话语权,导致有标准无法落、无人落、无力落的尴尬局面。数据治理平台的快速建设是治理制度落地的有力保障,实现端到端的快速落地,体现治理成果;
3)业务部门开展数据赋能,能力提升大比拼,以“用”促”治”,。
数据资产管理讲求“看选用治评”,其中“选”是难点。业务人员从拍脑袋做事到用数据说话,这是一个能力和意愿的组合问题。因此我们在数据治理同期提供数据分析人才培训(含认证)和内部项目实训,解决分析能力短缺和实际项目经验匮乏问题,并且结合内部数据分析项目评优,激发业务人员用数据的热情。解决数字化赋能过程中数据人才选拔缺标准、难动员、分工不明的问题,得到一举多得的功效。避免数据治理业务效果不明确时一开始自上而下命令导致业务部门的消极态度,IT部门自说自话、数据治理团队脱离业务运转的尴尬状况出现。
数据资管出品
作者:研究猿
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在神经网络模型搭建中,“最后一层是否添加激活函数”是新手常困惑的关键问题——有人照搬中间层的ReLU激活,导致回归任务输出异 ...
2025-12-05在机器学习落地过程中,“模型准确率高但不可解释”“面对数据噪声就失效”是两大核心痛点——金融风控模型若无法解释决策依据, ...
2025-12-05在CDA(Certified Data Analyst)数据分析师的能力模型中,“指标计算”是基础技能,而“指标体系搭建”则是区分新手与资深分析 ...
2025-12-05在回归分析的结果解读中,R方(决定系数)是衡量模型拟合效果的核心指标——它代表因变量的变异中能被自变量解释的比例,取值通 ...
2025-12-04在城市规划、物流配送、文旅分析等场景中,经纬度热力图是解读空间数据的核心工具——它能将零散的GPS坐标(如外卖订单地址、景 ...
2025-12-04在CDA(Certified Data Analyst)数据分析师的指标体系中,“通用指标”与“场景指标”并非相互割裂的两个部分,而是支撑业务分 ...
2025-12-04每到“双十一”,电商平台的销售额会迎来爆发式增长;每逢冬季,北方的天然气消耗量会显著上升;每月的10号左右,工资发放会带动 ...
2025-12-03随着数字化转型的深入,企业面临的数据量呈指数级增长——电商的用户行为日志、物联网的传感器数据、社交平台的图文视频等,这些 ...
2025-12-03在CDA(Certified Data Analyst)数据分析师的工作体系中,“指标”是贯穿始终的核心载体——从“销售额环比增长15%”的业务结论 ...
2025-12-03在神经网络训练中,损失函数的数值变化常被视为模型训练效果的“核心仪表盘”——初学者盯着屏幕上不断下降的损失值满心欢喜,却 ...
2025-12-02在CDA(Certified Data Analyst)数据分析师的日常工作中,“用部分数据推断整体情况”是高频需求——从10万条订单样本中判断全 ...
2025-12-02在数据预处理的纲量统一环节,标准化是消除量纲影响的核心手段——它将不同量级的特征(如“用户年龄”“消费金额”)转化为同一 ...
2025-12-02在数据驱动决策成为企业核心竞争力的今天,A/B测试已从“可选优化工具”升级为“必选验证体系”。它通过控制变量法构建“平行实 ...
2025-12-01在时间序列预测任务中,LSTM(长短期记忆网络)凭借对时序依赖关系的捕捉能力成为主流模型。但很多开发者在实操中会遇到困惑:用 ...
2025-12-01引言:数据时代的“透视镜”与“掘金者” 在数字经济浪潮下,数据已成为企业决策的核心资产,而CDA数据分析师正是挖掘数据价值的 ...
2025-12-01数据分析师的日常,常始于一堆“毫无章法”的数据点:电商后台导出的零散订单记录、APP埋点收集的无序用户行为日志、传感器实时 ...
2025-11-28在MySQL数据库运维中,“query end”是查询执行生命周期的收尾阶段,理论上耗时极短——主要完成结果集封装、资源释放、事务状态 ...
2025-11-28在CDA(Certified Data Analyst)数据分析师的工具包中,透视分析方法是处理表结构数据的“瑞士军刀”——无需复杂代码,仅通过 ...
2025-11-28在统计分析中,数据的分布形态是决定“用什么方法分析、信什么结果”的底层逻辑——它如同数据的“性格”,直接影响着描述统计的 ...
2025-11-27在电商订单查询、用户信息导出等业务场景中,技术人员常面临一个选择:是一次性查询500条数据,还是分5次每次查询100条?这个问 ...
2025-11-27