京公网安备 11010802034615号
经营许可证编号:京B2-20210330
01、什么是企业架构
企业架构并不是一个新的概念,那企业架构是做什么的呢?企业架构是对真实世界企业的业务流程和IT设施的抽象描述,包括企业战略、组织、职能、业务流程、IT系统等。对于数据领域来讲企业抽象是流程和信息流。在做模型化时要分离出哪些部分呢?比如流程描述把企业看成价值链,所谓价值链就是把原材料开始经过一系列的加工,最终实现为客户提供有价值的产品。
我们做个类比,一个城市需要做整体规划,也会做功能区规划,最终是建筑物和工程局部设计。同理,企业做IT也需要一个架构,企业架构是由很多模块组成,比如财务、供应链、生产系统等,不同模块下也有很多功能,也需要细致的设计。
肯定了企业要做架构,我们来看一下企业架构的历史,信息化架构发展历史是非常久远的,上世纪80年代末开始,直到2011年左右,企业架构被广泛接受。
02、Togaf的 ADM方法论
下面重点介绍下Togaf 的ADM方法论,即所谓的“一备一中心和八个阶段”,主要表现在以下四个方面:
1.预备阶段:达成要建设企业架构的共识,建立架构的保障机制,比如企业架构委员会。
2.设计阶段:包含业务架构、信息系统架构、技术架构,其中信息系统架构包含数据和应用。不同的业务形态,对架构的要求是不同的。比如非智能制造的生产型企业的数据应用需求主要是经营业绩分析,采用传统数仓架构即可;而智能客户运营阶段的服务型企业,数据应用需求主要是基于行为数据为基础的数据驱动的操作层面的业务决策,采用Hadoop架构更节约成本。
3.迁移规划阶段。架构设计完后,制定实施计划,进行架构的执行和迁移规划。
4.架构治理阶段。PMO对项目实施过程进行治理,并对业务或技术变更进行控制。
下面我们来细化一下架构设计方面的内容。
业务架构:主要由业务分析师来完成,包括静态的企业战略方位图、企业组织结构图和企业职能分解图,以及动态的企业业务轨迹图和业务流程图。根据业务流程图可以知道应用系统如何建设,这里面需要的数据是数据架构所需要涉及的。
应用架构:表示的是应用系统与业务系统的映射关系。
数据架构:主要包括数据模型、数据实体-业务功能矩阵、数据实体-应用系统矩阵。企业的数据模型有利于更深入地了解企业数据,便于梳理企业数据资产,便于企业贯彻数据标准。数据实体-业务功能矩阵中可以确认数据由哪些部门负责和使用,有利于权限分配。数据实体-应用系统矩阵,梳理某一数据在不同系统中分布情况。
技术架构:主要包括环境与位置图、网络计算图、平台分解图等。
03、TOGAF构架
主要分为6个部分,静态内容方法论,提供功能模板、参考模型、在架构开发时在不同的阶段进行架构开发指引和技术、企业连续系列参考和架构能力框架。
01、成为智慧企业的必经之路
在我国的大部分人的概念中,BI最大的特点就是对经营业绩、经营成果进行分析。BI宏观业务分析,基于报表和可视化的分析。AI是微观业务分析,建立起对微观个体的洞察以及未来行为的预测。面向BI的数据应用要求数据在数据仓库汇总和标准化即可,因此源系统可以是“竖井”,即数据模型和数据标准在源系统可以不统一。AI最终服务的不是业务报表,而是建模完成后最终返回到业务系统,在一些流程节点当中需要用到算法模型的输出,在业务系统中落地。业务系统中的标准和分析系统中的标准是一体化打通的,因此对IT系统是更为严格的要求。既然要做转变,我们需要做什么事情呢?我们可以从四个方面考虑,分为数据战略、数据架构、算法架构、数据平台。
1. 数据战略:将数据素养纳入组织愿景、战略和核心流程,制定企业级的数据应用规划。
2. 数据架构:根据数据应用的需求,以领域驱动设计为方法论,构建企业级的数据模型及其他组件。企业的数据模型视应用的方向不同,不限于传统的主题模型和维度模型,还有可能是复杂网络模型等等。其中数据模型会分层,面向应用的上层数据主要服务于经营分析、客户洞察、风险识别等;底层的数据更贴近源系统。
3. 算法架构:根据数据应用的需求,使用数据挖掘的方法论,构建企业级的算法模型及其组件。企业的算法模型是应用的方向不同,分为统计模型、机器学习模型、自优化模型等。一般分为两层结构,上层是算法实现层,下层是特征工程层。我们主要讲一下服务行业的算法架构,主要包括决策类预测、识别类模型和业务优化分析。算法模型需要从视角、观点、层次三个方面进行划分,即主体-客体视角、成本-收益观点、微观-宏观层次。对于决策类模型,属于客体视角、成本-收益可比的微观层次模型。识别类模型,属于主体视角、成本-收益不可比的微观层次模型。业务优化分析,属于宏观层次模型。
4. 数据和算法平台:为了支持不同的数据架构和算法架构,则需要建立不同的数据和算法平台。比如传统服务于经营分析的报表是小数据量的,使用单机关系型数据库架构即可,不需要算法平台;而服务于违规交易识别的复杂网络的数据模型,需要进行深度的特征学习,因此数据平台中需要图数据库模块,而算法平台中需要支持并行深度学习。
02、如何能做到持续智能
传统企业由于组织隔离,导致交付时间长、难以支持创新。如果希望提高创新速度、敏捷开发、缩短交付时间,则需要组建数据科学家、开发人员和运营人员携手合作的混合团队。
03、持续智能的能力建设
这是ThoughtWorks所倡导的持续智能能力,主要分为:
1. 识别变化,采用程式化的方式自动识别外部环境的改变,比如在信贷风控中,实时监控数据漂移和数据异常,评估准入规则和风控模型的适用性。
2. 敏捷研究,提供建模人员敏捷工作环境,缩短建模中占时80%的低效特征构建和价值验证工作。
3. 智能建模,在算法模型需要调整时,基于既有的标签和画像特征,快速迭代算法模型。
4. 智能评估,模型上线后,配置好回流数据,可以对模型进行实时评估。
5. 敏捷测试,对模型的稳健性进行快速的全方位测试,缩短算法模型开发和算法模型上线的时间,避免算法模型崩溃导致的业务中断。
举个例子,疫情期间很多传统模型无法使用,针对风险变化快速建模的能力显得尤为重要。因为客群发生很大的漂移,需要公司快速建模的能力,尤其是针对敏捷研究,可以在短时间内快速上线。
DataPipline实现标签提取,特征工程,样本选取。打通生产环境和分析环境的数据标准,实现企业级的数据标准版本管理和算法模型版本管理。对于分析建模人员而言,实现入模特征的所用即所得,避免模型上线时重新编辑特征。
DataOps敏捷研究智能建模,可以实现数据与算法的融合和管理。建立起端到端的数据算法模型开发团队,避免开发语言转换、数据转换等无效率环节。
04、ThoughtWorks数字化愿景
为了实现构建智慧、敏捷、场景驱动的美好愿望,需要实现深入客户洞察、缩短产品上市时间、创造数字化收益等战略子目标。数据资产和算法能力是支持各个战略子目标的基础。而ThoughtWorks认为支持能力建设的五个数字化基础组件是必不可少的,分别是低摩擦运营模式、企业级平台战略、用户体验设计和数字化产品能力、智能驱动的决策机制、工程师文化和持续交付的思维。
数据资管出品
作者:研究猿
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数据处理的全流程中,数据呈现与数据分析是两个紧密关联却截然不同的核心环节。无论是科研数据整理、企业业务复盘,还是日常数 ...
2026-03-06在数据分析、数据预处理场景中,dat文件是一种常见的二进制或文本格式数据文件,广泛应用于科研数据、工程数据、传感器数据等领 ...
2026-03-06在数据驱动决策的时代,CDA(Certified Data Analyst)数据分析师的核心价值,早已超越单纯的数据清洗与统计分析,而是通过数据 ...
2026-03-06在教学管理、培训数据统计、课程体系搭建等场景中,经常需要对课时数据进行排序并实现累加计算——比如,按课程章节排序,累加各 ...
2026-03-05在数据分析场景中,环比是衡量数据短期波动的核心指标——它通过对比“当前周期与上一个相邻周期”的数据,直观反映指标的月度、 ...
2026-03-05数据治理是数字化时代企业实现数据价值最大化的核心前提,而CDA(Certified Data Analyst)数据分析师作为数据全生命周期的核心 ...
2026-03-05在实验检测、质量控制、科研验证等场景中,“方法验证”是确保检测/分析结果可靠、可复用的核心环节——无论是新开发的检测方法 ...
2026-03-04在数据分析、科研实验、办公统计等场景中,我们常常需要对比两组数据的整体差异——比如两种营销策略的销售额差异、两种实验方案 ...
2026-03-04在数字化转型进入深水区的今天,企业对数据的依赖程度日益加深,而数据治理体系则是企业实现数据规范化、高质量化、价值化的核心 ...
2026-03-04在深度学习,尤其是卷积神经网络(CNN)的实操中,转置卷积(Transposed Convolution)是一个高频应用的操作——它核心用于实现 ...
2026-03-03在日常办公、数据分析、金融理财、科研统计等场景中,我们经常需要计算“平均值”来概括一组数据的整体水平——比如计算月度平均 ...
2026-03-03在数字化转型的浪潮中,数据已成为企业最核心的战略资产,而数据治理则是激活这份资产价值的前提——没有规范、高质量的数据治理 ...
2026-03-03在Excel办公中,数据透视表是汇总、分析繁杂数据的核心工具,我们常常通过它快速得到销售额汇总、人员统计、业绩分析等关键结果 ...
2026-03-02在日常办公和数据分析中,我们常常需要探究两个或多个数据之间的关联关系——比如销售额与广告投入是否正相关、员工出勤率与绩效 ...
2026-03-02在数字化运营中,时间序列数据是CDA(Certified Data Analyst)数据分析师最常接触的数据类型之一——每日的营收、每小时的用户 ...
2026-03-02在日常办公中,数据透视表是Excel、WPS等表格工具中最常用的数据分析利器——它能快速汇总繁杂数据、挖掘数据关联、生成直观报表 ...
2026-02-28有限元法(Finite Element Method, FEM)作为工程数值模拟的核心工具,已广泛应用于机械制造、航空航天、土木工程、生物医学等多 ...
2026-02-28在数字化时代,“以用户为中心”已成为企业运营的核心逻辑,而用户画像则是企业读懂用户、精准服务用户的关键载体。CDA(Certifi ...
2026-02-28在Python面向对象编程(OOP)中,类方法是构建模块化、可复用代码的核心载体,也是实现封装、继承、多态特性的关键工具。无论是 ...
2026-02-27在MySQL数据库优化中,索引是提升查询效率的核心手段—— 面对千万级、亿级数据量,合理创建索引能将查询时间从秒级压缩到毫秒级 ...
2026-02-27