京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据时代数据资产管理“五星模型”
伴随着大数据时代的悄然来临,数据的价值得到人们的广泛认同,对数据的重视提到了前所未有的高度。数据已经作为企业重要资产被广泛应用于盈利分析与预测、客户关系管理、合规性监管、运营风险关理等业务当中。
大数据与数据资产管理
数据就像企业的根基。然而并非所有数据都可能成为资产。如果没有将数据视为资产加以有效管理,即使数据再多,对于企业来说也只是垃圾和负担。在传统企业数据资产管理的过程中,以下六类问题非常普遍:
数据架构失控;
元数据管理混乱;
数据标准缺失;
数据质量参差不齐;
数据增长无序;
数据安全问题突出
导致这些问题的根本原因是数据资产管理与企业IT信息化的过程紧密相连。企业的IT建设过程不可能一蹴而就,而是通过长期不断的迭代演进而来。在这个过程中,大量数据沉睡在企业IT系统的存储介质中,没有得到充分发挥其价值的机会。
数据资产管理的核心
究竟具备什么样的特性,才可以将数据定义为资产呢?我们可以通过以下三个标准判断:可控制,可量化、可变现。
对于如何通过高效的数据资产管理,帮助企业凭借高质量的数据提供更精准的产品和服务、降低成本并控制风险,从而提升企业的核心竞争力,有人提出了由“三个基础”和“两个飞轮”组成的“数据资产管理五星模型”。
三个基础:
1.数据架构:驱动企业架构成熟度
“数据驱动一切”,对于大数据时代的企业发展来说,一点也不过分。在企业中,我们不难看到ERP、CRM、财务系统、技术架构、数据中心的运营和维护……,这些资源都有专人负责管理。而当数据成为企业核心资产后,又由谁来负责呢?
IT应该只负责How to Do的问题。改变架构,应该先从人改变;企业的变革,应该先从组织变革做起。当数据成为核心资产,企业应该设立专业责数据架构和管理的跨项目的专业数据管理实体化,或是虚拟的组织,不断完善数据架构,提升企业在数据规划、设计、开发和交付的质量,将IT系统建设生命周期从头到尾管理起来。
2.数据治理:治而不乱,让数据变成资产
现在IT部门最悲催的是,IT部门不是数据的owner,但当数据出现问题时却都来找IT部门:怪数据不准确、不可靠、不安全。
实际上,数据驱动的是企业的核心业务,因此数据治理不应该只是IT部门的职责。它还需要得到业务部门的广泛参与,通过部门间的沟通持续提供针对企业未来状态愿景的业务决策、业务定义、数据质量过程、以及开发优先级等方面的支持。共同商讨出的这个标准不一定最优,但却是在目前的工作实践中最有效、最合适的。
3.数据共享:大数据的基础
共享经济开启了新时代,数据共享是大数据的基础。所有基于互联网提供的工具解决的都是信任问题,没有信任作为基础,就没有共享的存在。
首先要在企业内部解决共享数据的问题。在大数据以前,企业都是用ESB,但人们逐渐发现,只有企业总线是无法解决问题的。因为服务的解决只是把复杂的问题用简单的方法封装起来,但看起来完美的调用并没有解决数据的核心问题,如数据的安全、质量、交互、价值,只是用service进行完美封装,但并没有得到解决。
现在通常存在一个悖论:企业建设大数据中心时投入的资金,要远远大于从数据中心中获得的收益。真正用到数据的时候,我们才发现,数据的质量低下,影响分析精度;没有清晰元数据,数据无法理解和运用,数据分析无从入手;无法充分利用数据,可以使用于分析和应用的数据只是冰山一角;数据访问不受限制,数据安全问题突出……种种问题的产生才让我们看到,我们建立的不是大数据中心,而是大数据沼泽!
因此,在企业建立大数据中心之初,就要避免单纯将数据整合到一起而不加以有效的管理。对于中小企业,大数据的敏捷化之道就是场景化驱动。一定要围绕企业最根本的业务需求,而不是为了大数据而大数据,不是说因为Hadoop火,我就一定要使用Hadoop。中小企业需要更灵活、更快速、更高性价比的解决方案。
两个飞轮
1.数据增值与变现
在解决好管理的基础之后,才能谈到数据的增值和变现。数据的增值与变现应该分别从企业内、外两个角度来看。
对内强化能力,数据资产增值:对绝大多数的企业来说,并不是用户不够,而是没有把用户经营好。不是企业的产品和服务不够,而是太多。当企业形成了一套整体的数据思维之后,就要分析如何在企业内部重构产品、重构用户定义,重新审视主营业务的用户是不是最佳的,用没有高价值的用户还没有被挖掘出来,有没有长尾的价值还没有发挥出来。
经营内部后,我们才能开始实现对外部更好的经营。
数据资产变现:对外呈现价值:企业在面对客户维度不够、产品信息不全等问题时,就要主动拓展到企业外部,进行进行数据跨界合作,补全客户信息及产品流通信息,实现数据增值,最终驱动主营业务成长。
2.场景变现
我们现在经常能听到一句话:无场景不驱动。貌似场景可以革命一切。到底场景带来什么?
基于大数据变现场景化,是数据应用的必然趋势。没数有据变为现这场景的数据,也就意味着它只会是一堆没用的垃圾; 但要在“场景营销”中获胜,企业需要应用数据进行更有效的分析,不断完善应用和变现的场景。
以互联网保险为例。程永新认为未来所以的变现公司都有可能是互联网公司,因为保险行业有非常好的现金流。它没有实质性的产品,只是一纸合约,因此非常容易实现互联网化。目前,互联网非车险保费主要集中在四类,其中基于大数据的场景化产品(如网络购物、出 行、健康)占大部分。
而数据跨界合作推动转型升级则是传统企业数据变现的重要场景。企业数据增值的形式,不仅仅是数据租售,或者数据分析结果的变现;而是通过跨界战略合作,用数据共享来推动彼此主营业务,实现远高于简单的数据租售速来的直接经济价值。
下图展示的是企业大数据建设一般建议推进思路。
值得注意的是,在我们思考的时候往往是自上而下进行,但实际用技术落地一定是自下而上的。在通过大数据建设来驱动业务的过程中,我们最有效的办法就是小步快跑,不断找一些小的场景,尝试小的平台,用高质量的数据指导企业作出明智及有效的决策。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在神经网络模型搭建中,“最后一层是否添加激活函数”是新手常困惑的关键问题——有人照搬中间层的ReLU激活,导致回归任务输出异 ...
2025-12-05在机器学习落地过程中,“模型准确率高但不可解释”“面对数据噪声就失效”是两大核心痛点——金融风控模型若无法解释决策依据, ...
2025-12-05在CDA(Certified Data Analyst)数据分析师的能力模型中,“指标计算”是基础技能,而“指标体系搭建”则是区分新手与资深分析 ...
2025-12-05在回归分析的结果解读中,R方(决定系数)是衡量模型拟合效果的核心指标——它代表因变量的变异中能被自变量解释的比例,取值通 ...
2025-12-04在城市规划、物流配送、文旅分析等场景中,经纬度热力图是解读空间数据的核心工具——它能将零散的GPS坐标(如外卖订单地址、景 ...
2025-12-04在CDA(Certified Data Analyst)数据分析师的指标体系中,“通用指标”与“场景指标”并非相互割裂的两个部分,而是支撑业务分 ...
2025-12-04每到“双十一”,电商平台的销售额会迎来爆发式增长;每逢冬季,北方的天然气消耗量会显著上升;每月的10号左右,工资发放会带动 ...
2025-12-03随着数字化转型的深入,企业面临的数据量呈指数级增长——电商的用户行为日志、物联网的传感器数据、社交平台的图文视频等,这些 ...
2025-12-03在CDA(Certified Data Analyst)数据分析师的工作体系中,“指标”是贯穿始终的核心载体——从“销售额环比增长15%”的业务结论 ...
2025-12-03在神经网络训练中,损失函数的数值变化常被视为模型训练效果的“核心仪表盘”——初学者盯着屏幕上不断下降的损失值满心欢喜,却 ...
2025-12-02在CDA(Certified Data Analyst)数据分析师的日常工作中,“用部分数据推断整体情况”是高频需求——从10万条订单样本中判断全 ...
2025-12-02在数据预处理的纲量统一环节,标准化是消除量纲影响的核心手段——它将不同量级的特征(如“用户年龄”“消费金额”)转化为同一 ...
2025-12-02在数据驱动决策成为企业核心竞争力的今天,A/B测试已从“可选优化工具”升级为“必选验证体系”。它通过控制变量法构建“平行实 ...
2025-12-01在时间序列预测任务中,LSTM(长短期记忆网络)凭借对时序依赖关系的捕捉能力成为主流模型。但很多开发者在实操中会遇到困惑:用 ...
2025-12-01引言:数据时代的“透视镜”与“掘金者” 在数字经济浪潮下,数据已成为企业决策的核心资产,而CDA数据分析师正是挖掘数据价值的 ...
2025-12-01数据分析师的日常,常始于一堆“毫无章法”的数据点:电商后台导出的零散订单记录、APP埋点收集的无序用户行为日志、传感器实时 ...
2025-11-28在MySQL数据库运维中,“query end”是查询执行生命周期的收尾阶段,理论上耗时极短——主要完成结果集封装、资源释放、事务状态 ...
2025-11-28在CDA(Certified Data Analyst)数据分析师的工具包中,透视分析方法是处理表结构数据的“瑞士军刀”——无需复杂代码,仅通过 ...
2025-11-28在统计分析中,数据的分布形态是决定“用什么方法分析、信什么结果”的底层逻辑——它如同数据的“性格”,直接影响着描述统计的 ...
2025-11-27在电商订单查询、用户信息导出等业务场景中,技术人员常面临一个选择:是一次性查询500条数据,还是分5次每次查询100条?这个问 ...
2025-11-27