
01、什么是企业架构
企业架构并不是一个新的概念,那企业架构是做什么的呢?企业架构是对真实世界企业的业务流程和IT设施的抽象描述,包括企业战略、组织、职能、业务流程、IT系统等。对于数据领域来讲企业抽象是流程和信息流。在做模型化时要分离出哪些部分呢?比如流程描述把企业看成价值链,所谓价值链就是把原材料开始经过一系列的加工,最终实现为客户提供有价值的产品。
我们做个类比,一个城市需要做整体规划,也会做功能区规划,最终是建筑物和工程局部设计。同理,企业做IT也需要一个架构,企业架构是由很多模块组成,比如财务、供应链、生产系统等,不同模块下也有很多功能,也需要细致的设计。
肯定了企业要做架构,我们来看一下企业架构的历史,信息化架构发展历史是非常久远的,上世纪80年代末开始,直到2011年左右,企业架构被广泛接受。
02、Togaf的 ADM方法论
下面重点介绍下Togaf 的ADM方法论,即所谓的“一备一中心和八个阶段”,主要表现在以下四个方面:
1.预备阶段:达成要建设企业架构的共识,建立架构的保障机制,比如企业架构委员会。
2.设计阶段:包含业务架构、信息系统架构、技术架构,其中信息系统架构包含数据和应用。不同的业务形态,对架构的要求是不同的。比如非智能制造的生产型企业的数据应用需求主要是经营业绩分析,采用传统数仓架构即可;而智能客户运营阶段的服务型企业,数据应用需求主要是基于行为数据为基础的数据驱动的操作层面的业务决策,采用Hadoop架构更节约成本。
3.迁移规划阶段。架构设计完后,制定实施计划,进行架构的执行和迁移规划。
4.架构治理阶段。PMO对项目实施过程进行治理,并对业务或技术变更进行控制。
下面我们来细化一下架构设计方面的内容。
业务架构:主要由业务分析师来完成,包括静态的企业战略方位图、企业组织结构图和企业职能分解图,以及动态的企业业务轨迹图和业务流程图。根据业务流程图可以知道应用系统如何建设,这里面需要的数据是数据架构所需要涉及的。
应用架构:表示的是应用系统与业务系统的映射关系。
数据架构:主要包括数据模型、数据实体-业务功能矩阵、数据实体-应用系统矩阵。企业的数据模型有利于更深入地了解企业数据,便于梳理企业数据资产,便于企业贯彻数据标准。数据实体-业务功能矩阵中可以确认数据由哪些部门负责和使用,有利于权限分配。数据实体-应用系统矩阵,梳理某一数据在不同系统中分布情况。
技术架构:主要包括环境与位置图、网络计算图、平台分解图等。
03、TOGAF构架
主要分为6个部分,静态内容方法论,提供功能模板、参考模型、在架构开发时在不同的阶段进行架构开发指引和技术、企业连续系列参考和架构能力框架。
01、成为智慧企业的必经之路
在我国的大部分人的概念中,BI最大的特点就是对经营业绩、经营成果进行分析。BI宏观业务分析,基于报表和可视化的分析。AI是微观业务分析,建立起对微观个体的洞察以及未来行为的预测。面向BI的数据应用要求数据在数据仓库汇总和标准化即可,因此源系统可以是“竖井”,即数据模型和数据标准在源系统可以不统一。AI最终服务的不是业务报表,而是建模完成后最终返回到业务系统,在一些流程节点当中需要用到算法模型的输出,在业务系统中落地。业务系统中的标准和分析系统中的标准是一体化打通的,因此对IT系统是更为严格的要求。既然要做转变,我们需要做什么事情呢?我们可以从四个方面考虑,分为数据战略、数据架构、算法架构、数据平台。
1. 数据战略:将数据素养纳入组织愿景、战略和核心流程,制定企业级的数据应用规划。
2. 数据架构:根据数据应用的需求,以领域驱动设计为方法论,构建企业级的数据模型及其他组件。企业的数据模型视应用的方向不同,不限于传统的主题模型和维度模型,还有可能是复杂网络模型等等。其中数据模型会分层,面向应用的上层数据主要服务于经营分析、客户洞察、风险识别等;底层的数据更贴近源系统。
3. 算法架构:根据数据应用的需求,使用数据挖掘的方法论,构建企业级的算法模型及其组件。企业的算法模型是应用的方向不同,分为统计模型、机器学习模型、自优化模型等。一般分为两层结构,上层是算法实现层,下层是特征工程层。我们主要讲一下服务行业的算法架构,主要包括决策类预测、识别类模型和业务优化分析。算法模型需要从视角、观点、层次三个方面进行划分,即主体-客体视角、成本-收益观点、微观-宏观层次。对于决策类模型,属于客体视角、成本-收益可比的微观层次模型。识别类模型,属于主体视角、成本-收益不可比的微观层次模型。业务优化分析,属于宏观层次模型。
4. 数据和算法平台:为了支持不同的数据架构和算法架构,则需要建立不同的数据和算法平台。比如传统服务于经营分析的报表是小数据量的,使用单机关系型数据库架构即可,不需要算法平台;而服务于违规交易识别的复杂网络的数据模型,需要进行深度的特征学习,因此数据平台中需要图数据库模块,而算法平台中需要支持并行深度学习。
02、如何能做到持续智能
传统企业由于组织隔离,导致交付时间长、难以支持创新。如果希望提高创新速度、敏捷开发、缩短交付时间,则需要组建数据科学家、开发人员和运营人员携手合作的混合团队。
03、持续智能的能力建设
这是ThoughtWorks所倡导的持续智能能力,主要分为:
1. 识别变化,采用程式化的方式自动识别外部环境的改变,比如在信贷风控中,实时监控数据漂移和数据异常,评估准入规则和风控模型的适用性。
2. 敏捷研究,提供建模人员敏捷工作环境,缩短建模中占时80%的低效特征构建和价值验证工作。
3. 智能建模,在算法模型需要调整时,基于既有的标签和画像特征,快速迭代算法模型。
4. 智能评估,模型上线后,配置好回流数据,可以对模型进行实时评估。
5. 敏捷测试,对模型的稳健性进行快速的全方位测试,缩短算法模型开发和算法模型上线的时间,避免算法模型崩溃导致的业务中断。
举个例子,疫情期间很多传统模型无法使用,针对风险变化快速建模的能力显得尤为重要。因为客群发生很大的漂移,需要公司快速建模的能力,尤其是针对敏捷研究,可以在短时间内快速上线。
DataPipline实现标签提取,特征工程,样本选取。打通生产环境和分析环境的数据标准,实现企业级的数据标准版本管理和算法模型版本管理。对于分析建模人员而言,实现入模特征的所用即所得,避免模型上线时重新编辑特征。
DataOps敏捷研究智能建模,可以实现数据与算法的融合和管理。建立起端到端的数据算法模型开发团队,避免开发语言转换、数据转换等无效率环节。
04、ThoughtWorks数字化愿景
为了实现构建智慧、敏捷、场景驱动的美好愿望,需要实现深入客户洞察、缩短产品上市时间、创造数字化收益等战略子目标。数据资产和算法能力是支持各个战略子目标的基础。而ThoughtWorks认为支持能力建设的五个数字化基础组件是必不可少的,分别是低摩擦运营模式、企业级平台战略、用户体验设计和数字化产品能力、智能驱动的决策机制、工程师文化和持续交付的思维。
数据资管出品
作者:研究猿
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
随机森林算法的核心特点:原理、优势与应用解析 在机器学习领域,随机森林(Random Forest)作为集成学习(Ensemble Learning) ...
2025-09-05Excel 区域名定义:从基础到进阶的高效应用指南 在 Excel 数据处理中,频繁引用单元格区域(如A2:A100、B3:D20)不仅容易出错, ...
2025-09-05CDA 数据分析师:以六大分析方法构建数据驱动业务的核心能力 在数据驱动决策成为企业共识的当下,CDA(Certified Data Analyst) ...
2025-09-05SQL 日期截取:从基础方法到业务实战的全维度解析 在数据处理与业务分析中,日期数据是连接 “业务行为” 与 “时间维度” 的核 ...
2025-09-04在卷积神经网络(CNN)的发展历程中,解决 “梯度消失”“特征复用不足”“模型参数冗余” 一直是核心命题。2017 年提出的密集连 ...
2025-09-04CDA 数据分析师:驾驭数据范式,释放数据价值 在数字化转型浪潮席卷全球的当下,数据已成为企业核心生产要素。而 CDA(Certified ...
2025-09-04K-Means 聚类:无监督学习中数据分群的核心算法 在数据分析领域,当我们面对海量无标签数据(如用户行为记录、商品属性数据、图 ...
2025-09-03特征值、特征向量与主成分:数据降维背后的线性代数逻辑 在机器学习、数据分析与信号处理领域,“降维” 是破解高维数据复杂性的 ...
2025-09-03CDA 数据分析师与数据分析:解锁数据价值的关键 在数字经济高速发展的今天,数据已成为企业核心资产与社会发展的重要驱动力。无 ...
2025-09-03解析 loss.backward ():深度学习中梯度汇总与同步的自动触发核心 在深度学习模型训练流程中,loss.backward()是连接 “前向计算 ...
2025-09-02要解答 “画 K-S 图时横轴是等距还是等频” 的问题,需先明确 K-S 图的核心用途(检验样本分布与理论分布的一致性),再结合横轴 ...
2025-09-02CDA 数据分析师:助力企业破解数据需求与数据分析需求难题 在数字化浪潮席卷全球的当下,数据已成为企业核心战略资产。无论是市 ...
2025-09-02Power BI 度量值实战:基于每月收入与税金占比计算累计税金分摊金额 在企业财务分析中,税金分摊是成本核算与利润统计的核心环节 ...
2025-09-01巧用 ALTER TABLE rent ADD INDEX:租房系统数据库性能优化实践 在租房管理系统中,rent表是核心业务表之一,通常存储租赁订单信 ...
2025-09-01CDA 数据分析师:企业数字化转型的核心引擎 —— 从能力落地到价值跃迁 当数字化转型从 “选择题” 变为企业生存的 “必答题”, ...
2025-09-01数据清洗工具全景指南:从入门到进阶的实操路径 在数据驱动决策的链条中,“数据清洗” 是决定后续分析与建模有效性的 “第一道 ...
2025-08-29机器学习中的参数优化:以预测结果为核心的闭环调优路径 在机器学习模型落地中,“参数” 是连接 “数据” 与 “预测结果” 的关 ...
2025-08-29CDA 数据分析与量化策略分析流程:协同落地数据驱动价值 在数据驱动决策的实践中,“流程” 是确保价值落地的核心骨架 ——CDA ...
2025-08-29CDA含金量分析 在数字经济与人工智能深度融合的时代,数据驱动决策已成为企业核心竞争力的关键要素。CDA(Certified Data Analys ...
2025-08-28CDA认证:数据时代的职业通行证 当海通证券的交易大厅里闪烁的屏幕实时跳动着市场数据,当苏州银行的数字金融部连夜部署新的风控 ...
2025-08-28