京公网安备 11010802034615号
经营许可证编号:京B2-20210330
我们知道,世界上唯一不变的就是变化本身,因此变革管理是商业永恒的话题。
变革管理的两个重要工具便是数据资产管理和精益流程管理。
前者使得机构“知炎凉,知利害“,后者使得机构明白自身特点,做到上令下达,这里我们只说前者。“知炎凉“是一个下情上传的过程,从业务数据采集到数据挖掘模型实现洞察,为组织的决策机构提供制定策略的依据。比如在根据客户提供的信息预测出如果赊销或授予贷款后违约的可能性。”知利害“是组织中各级管理者分析决策过程,经常需要结合各种报表和可视化工具进行决策支持。报表体系是对最终经营指标的逐级拆分,比如著名的杜邦财务分析体系,将制造业企业的资产收益率这个最终企业价值衡量指标拆解为由收入、成本和周转率组成的业务部门可操纵的KPI指标。又比如,在信贷业务中,将产品利润率拆分为贷款利率、获客成本率、审批通过率、不良率等。最低层次的指标,比如不良率指标,可以通过上面提到的数据挖掘模型对每个申请者未来的不良率进行预测。
策略制定者根据每个潜在贷款用户的不良率的预测值,以产品总的利润率最大化为目标,对申请者进行取舍。说到这里,读者就明白了数据人的两个基本工作,那就是制作汇报报表和建立数据挖掘模型。如下图所示,左侧的任务是对接各数据源,根据业务部门认可的标准,核定数据质量和含义,根据计算方法制作报表,供决策人员使用;右侧的任务是对每个用户、产品和渠道打标签,在业务主题之下建立算法模型并根据每个个体的预测值过滤名单,并在决策引擎中配置相应的业务执行策略,实现信贷审批或精准营销自动化,最后还有评价阈值选取和策略的执行效果,作为下一步优化的依据。
以上说的应用点比较抽象,下面列举一下数据挖掘的常见业务场景。
客户智能主要是基于对客户的洞察,以实现客户全生命周期价值提升为目的的分析场景。比如在初次获客时识别高价值客户,并进行重点营销,提高单客价值。这里的风险智能指的是狭义的信贷风险,主要是指授信业务前识别出申请者的还款意愿、还款能力和真实意图,降低违约成本。财务智能则是关注机构资金的运行效率和流动性安全,需要对宏观和行业指标进行精确预测,合理分配资金资源,降低无效配置成本。运营智能可以识别并发现不合理事件,降低操作风险的成本。
数据资产在为企业提供价值的时候,会遇到很多问题,主要表现为以下三点:
1)部门各自为政,数据反复清洗加工、分析工具重复采购、挖掘成果小范围使用、先进经验未能共享;
2)数据割裂:管理条线间数据割裂、数据来源间未能打通、数据脱敏后丧失价值,比如我们在做洗钱交易识别时发现交易对手的唯一标示全部是星号,这就是选取了错误的脱敏方式导致的不可恢复的错误后果;
3)缺乏系统性管理:缺乏全面的围绕客户、风险、运营、财务等全面规划分析场景,执行过程随意,流程体系不健全,保障不到位,数据和模型资产流失严重。
数据治理便是为数据资产保值增值而服务的。
其目标是消除歧义、减少数据孤岛,降低数据使用成本,提高对业务的响应,提高对数据隐私安全保护。
实施数据治理可以为数据管理提供可信任的数据,减少数据重复,增强业务和IT对于数据的信心,改善数据的及时性和可用性,建立通用的数据词汇表,以确保访问正确的信息,定义企业范围(或站点/项目范围)的值以获取公共参考数据,提供信息和指导,以协助有关数据的合规性和监管工作。
过去提到数据治理,更多的被认为是IT部门的事,其实不是这样的。就拿数据质量举例吧,数据来自业务,它产生于业务,获取自业务系统,数据质量标准也是业务部门订的,数据人只是帮业务人员落地质量检验,但是数据有质量问题,是不能直接解决的。业务部门如果不太关心数据质量,比如说最近金融监管部门对洗钱行为监管更严格了,很多银行希望买套系统或者寄希望于AI算法识别洗钱行为,但是很多金融机构对最基本客户信息还不了解,连客户基本的联系方式和地址都存在大量缺失,这很难保证客户的真实性。
举个例子,一间屋里注册了六家公司,这些公司肯定是空壳公司。数据质量如果由IT负责很难满足要求,因为业务人员办理业务的时候根本不去核实这个地址的真实性,地址写不写他都不太关心。把数据质量提升的工作压到IT人员根本解决不了问题。
数据治理在国外自上世纪80年代应企业自身数据资产管理诉求而内生发展起来。我们企业最早于2003年提出数据治理概念,之后银行业应监管要求,自2005年逐步加强对数据治理的重视和投资力度。取得了丰硕的成果,但是往往带有“运动”的特征。一提到数据治理,更多的是关注自顶向下的制度设计,而忽视自底向上业务的驱动。很多时候是IT闭门造车,还提出基于IT架构的数据治理。
感觉这很专业啊,但是我举个例子,比如我今天想吃饭了,得看看家里有什么菜,至于符不符合口味不知道,有什么就吃什么。
这是基于IT架构的数据治理,只管盘点现有系统和现有数据。这个方法确实有其用处,但是不应该作为数据治理的主导。因此,以往的数据治理经常出现有数据治理组织架构,却无合适的人到岗;有数据标准等规章制度,而在新旧系统上无法落地。
因此,ThoughtWorks数据智能事业部呼吁国内企业回到价值导向的数据治理的初心,提出精益数据治理,不仅从上至下,并且自底向上,围绕业务场景,以价值驱动数据治理的具体体现。
精益数据治理讲求价值驱动,围绕场景,减少浪费,持续改进。体现为以下五个特点:
1)从业务愿景出发识别价值,在适当的时间为内部客户提供价值是精益数据治理的关键要求,通过对齐业务战略和目标来识别有价值的数据利用场景。
2)构建价值流,识别出场景后,在源数据和场景之间建立价值流,价值流是将产品或服务带给用户所需的资源和信息流,需要构建和改进价值流,避免浪费。
3)使价值从源头流向用户,“流”使价值能够以经过最少的阶段和活动便能交付,无缝流是精益数据治理的关键要求。减少浪费是精益数据治理的重要策略,我们发现,所有的数据质量的问题,都能够与精益思想的7种浪费一一对应起来,解决了数据生产的浪费问题,就大部分解决了数据质量问题。
4)拉动价值流,只有在内部客户有需求时,流程才能运行,此阶段强调仅在有需求时才需要响应。
5)不断迭代,精益求精,持续改进以追求完善,实现可持续变革。
ThoughtWorks数据智能事业部根据多年辅导企业数字化转型的实践,推出价值导向的数据治理实施路径。其有三点异于传统数据治理实施路径:
1)以数据探查代替需求访谈。
精益数据治理是以在数据应用为纲,但是在数据治理初期,企业管理人员对数据应用的价值认识是模糊的,有些只是一些想法,往往难以指导数据应用规划的制定。因此我们借用敏捷开发的工具,创造出精益数据探索工作坊,帮助企业构建数据驱动的创新战略,发现数据创新场景,验证和制定数据应用创新计划;
2)IT部门数据中台敏捷开发。
以往数据治理往往分为咨询、落地等多个阶段,并且把数据标准落地、质量监控这些重要任务留给甲方自行完成。根据我们的观察,数据标准落地部门往往缺乏新IT系统上线评审的话语权,导致有标准无法落、无人落、无力落的尴尬局面。数据治理平台的快速建设是治理制度落地的有力保障,实现端到端的快速落地,体现治理成果;
3)业务部门开展数据赋能,能力提升大比拼,以“用”促”治”,。
数据资产管理讲求“看选用治评”,其中“选”是难点。业务人员从拍脑袋做事到用数据说话,这是一个能力和意愿的组合问题。因此我们在数据治理同期提供数据分析人才培训(含认证)和内部项目实训,解决分析能力短缺和实际项目经验匮乏问题,并且结合内部数据分析项目评优,激发业务人员用数据的热情。解决数字化赋能过程中数据人才选拔缺标准、难动员、分工不明的问题,得到一举多得的功效。避免数据治理业务效果不明确时一开始自上而下命令导致业务部门的消极态度,IT部门自说自话、数据治理团队脱离业务运转的尴尬状况出现。
数据资管出品
作者:研究猿
CDA学员免费下载查看报告全文:2026全球数智化人才指数报告【CDA数据科学研究院】.pdf
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数字化时代,数据已成为企业决策的核心驱动力,数据分析与数据挖掘作为解锁数据价值的关键手段,广泛应用于互联网、金融、医疗 ...
2026-04-17在数据处理、后端开发、报表生成与自动化脚本中,将 SQL 查询结果转换为字符串是一项高频且实用的操作。无论是拼接多行数据为逗 ...
2026-04-17面对一份上万行的销售明细表,要快速回答“哪个地区卖得最好”“哪款产品增长最快”“不同客户类型的购买力如何”——这些看似复 ...
2026-04-17数据分析师一天的工作,80% 的时间围绕表格结构数据展开。从一张销售明细表到一份完整的分析报告,表格结构数据贯穿始终。但你真 ...
2026-04-16在机器学习无监督学习领域,Kmeans聚类因其原理简洁、计算高效、可扩展性强的优势,成为数据聚类任务中的主流算法,广泛应用于用 ...
2026-04-16在机器学习建模实践中,特征工程是决定模型性能的核心环节之一。面对高维数据集,冗余特征、无关特征不仅会增加模型训练成本、延 ...
2026-04-16在数字化时代,用户是产品的核心资产,用户运营的本质的是通过科学的指标监测、分析与优化,实现“拉新、促活、留存、转化、复购 ...
2026-04-15在企业数字化转型、系统架构设计、数据治理与AI落地过程中,数据模型、本体模型、业务模型是三大核心基础模型,三者相互支撑、各 ...
2026-04-15数据分析师的一天,80%的时间花在表格数据上,但80%的坑也踩在表格数据上。 如果你分不清数值型和文本型的区别,不知道数据从哪 ...
2026-04-15在人工智能与机器学习落地过程中,模型质量直接决定了应用效果的优劣——无论是分类、回归、生成式模型,还是推荐、预测类模型, ...
2026-04-14在Python网络编程、接口测试、爬虫开发等场景中,HTTP请求的发送与响应处理是核心需求。Requests库作为Python生态中最流行的HTTP ...
2026-04-14 很多新人学完Python、SQL,拿到一张Excel表还是不知从何下手。 其实,90%的商业分析问题,都藏在表格的结构里。 ” 引言:为 ...
2026-04-14在回归分析中,因子(即自变量)的筛选是构建高效、可靠回归模型的核心步骤——实际分析场景中,往往存在多个候选因子,其中部分 ...
2026-04-13在机器学习模型开发过程中,过拟合是制约模型泛化能力的核心痛点——模型过度学习训练数据中的噪声与偶然细节,导致在训练集上表 ...
2026-04-13在数据驱动商业升级的今天,商业数据分析已成为企业精细化运营、科学决策的核心手段,而一套规范、高效的商业数据分析总体流程, ...
2026-04-13主讲人简介 张冲,海归统计学硕士,CDA 认证数据分析师,前云南白药集团资深数据分析师,自媒体 Python 讲师,全网课程播放量破 ...
2026-04-13在数据可视化与业务分析中,同比分析是衡量业务发展趋势、识别周期波动的核心手段,其核心逻辑是将当前周期数据与上年同期数据进 ...
2026-04-13在机器学习模型的落地应用中,预测精度并非衡量模型可靠性的唯一标准,不确定性分析同样不可或缺。尤其是在医疗诊断、自动驾驶、 ...
2026-04-10数据本身是沉默的,唯有通过有效的呈现方式,才能让其背后的规律、趋势与价值被看见、被理解、被运用。统计制图(数据可视化)作 ...
2026-04-10在全球化深度发展的今天,跨文化传播已成为连接不同文明、促进多元共生的核心纽带,其研究核心围绕“信息传递、文化解读、意义建 ...
2026-04-09