京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据改变智慧产生方式 企业IT架构需先行应变
大数据成为业界最热门的话题之一,事实上,几千年来我们一直在利用数据,数据并不是新概念。但大数据的价值最近几年才被公众关注到,这有着时代背景的原因。比如说石油,石油在几千年前就被发现了,但一直被用作日常生活或战争中的燃料,并不是特别重要的战略物资。在内燃机发明以后,石油成为最重要的动力能源,并在最近的100年中成为战略物资。
如今,大数据也迎来了黄金时代,随着云存储、云计算技术的成熟,大数据的存储与处理能力有了技术条件。企业可以利用生产系统以及管理系统中产生的大量数据,一方面对自己的生产活动进行更为准确的预测与指导,从而提高生产活动的准确性;另一方面通过对大数据价值的挖掘,开发新的业务和服务。比如谷歌,仅仅通过搜索关键字的历史数据,就相当准确地预测了流感的传播路径。在这样的环境下,大数据才像石油一样,成为重要的战略资源。
当然,各企业也都规划了自己的大数据策略,在2014第四届大数据世界论坛期间,C114采访了中兴通讯中心研究院副院长陈坚以及中心研究院总工王德政,分享了中兴通讯对大数据发展趋势的看法。
最大的变化是智慧产生方式
就像每个人心中都有一个哈姆雷特一样,每个人对大数据的定义也各有不同。在陈坚看来,大数据的价值就在于透过表象,究其本质,提升人类活动的准确性,减少传统方式下的“试错”成本,从而提升效率。
举个例子,在发生重大案件时,可以通过卡口的摄像资料,实时生成嫌疑车辆的运动轨迹与活动范围,提高案件侦破的效率。这些,归根结底,都是通过提高人类活动的准确性来提高整个社会的生产效率。
王德政表示,中兴作为一家拥有几万名员工的企业,本身也是大数据的拥有者,大数据应用的案例也是随处可见。比如,通过员工打卡记录与网络登录记录的关联挖掘,发现工作中的违例现象;通过对公司内部论坛的挖掘分析,加强对未来技术的敏感度,防止技术决策失误等等。
同时,中兴在项目研发的过程中,产生了大量的项目研发过程数据。在以往传统的项目管理中,衡量一个项目执行进度是否正常,基本上是依赖项目成员的主动报告。但项目成员的主动报告,有时会掩盖项目中实际的进度延误,以及项目执行情况的恶化。近期,中兴在考虑针对项目研发过程数据进行建模,通过大数据的挖掘分析,对正在执行项目的健康度进行评估,与项目组的主动报告对照印证,尽早发现项目执行过程中的风险。
陈坚认为,未来大数据挖掘带来的最大变化是智慧产生方式的变化。在传统的智慧生成模式中主要依赖人类专家。例如,你我是各自领域的专家,我们通过长时间的经验积累,可以在合理的时间内针对自己领域内的问题给出判断,这就是一个典型的智慧生成过程。而大数据挖掘带来的变化就是,大数据系统通过数据分析挖掘,累积经验库,并生成智慧,以减少对人类专家的依赖,至少是在数量上减少对人类专家的需求量。这样的情景,将会蔓延到各行各业,延伸到人类社会的各个角落,像文字的普及一样,将永久性地改变人类思考问题的方式甚至生活方式,这需要人类提前准备、适应这种变化。
大数据是运营商的必然选择
但并不是所有的数据都具有价值,陈坚认为,一个高价值的数据集应该满足这样几个特征:首先,这个数据集应该与物理世界有较为广泛的对应关系,而不是纯粹的虚拟数据;其二,这个数据集不是纯粹的静态数据,而应该是可以实时更新的数据;其三,如果这个数据集具备物理位置等信息,将具备更大的价值。
现在运营商对电信数据价值的认识和价值探索,也越来越深刻。比如,用户对服务质量不满意时,往往只有少数人会打客服电话进行投诉。不满意的客户,很可能在自己的亲友圈中散发大量的负面情绪。按照传统的通过客服主动大面积撒网去消除这种负面影响,就需要付出非常高的成本。如果利用收集到的电信系统中的过程信令数据,并加以分析,有效评估出客户体验最差的群体,再对这些特定客户群进行主动关怀,提高关怀行为的准确性,就能够以较小的代价,主动消除这些不满意客户所产生的负面影响。
现在,大数据在电信业的应用,一方面用来改进网络本身,降低维护成本;另一方面通过分析挖掘开发新的业务,增加收入,这些都将成为电信运营商的必然选择。
适应需求的IT系统架构特点
应用的需求,也对企业的IT系统架构提出了新的要求,比如要满足海量应用、在线计算。
陈坚表示,中兴近期推出的DAP平台在系统架构的设计中,采用清晰而标准的系统分层架构,可以根据不同行业的特点,方便快捷地引入第三方的软硬件模块,保证客户利益的最大化。DAP平台利用云存储与云计算的技术,对海量的数据进行存储、挖掘分析,帮助企业充分开发数据的价值。
王德政补充说,与其他的系统相比,DAP平台有三个最重要的方面:
首先,DAP采用货架式架构,采用企业总线ESB的技术,可以灵活地对各个组件模块进行裁剪与拼装。满足“集成”与“被集成”的两种角色要求。当前各个行业已有大量的生产系统在线运行,完全重构这些系统无论从经济成本上,还是时间成本,都无法承受。所以,未来的大数据系统必然要同时承担两种角色:既可以作为原有生产系统的一个子系统被集成,也可以作为主系统去集成原有的生产系统。
中兴的DAP货架式架构就可以灵活适应各类“集成”与“被集成”的场景,在不影响生产系统稳定性的前提下,与原有生产系统无缝集成,引入大数据系统。
其次,DAP在数据分析挖掘层面的智慧生成的特征,可以提高企业活动的准确性。未来的大数据系统能否生成智慧,替代人类专家,是区分大数据系统与传统IT系统的关键特征。一个无法生成智慧的系统,无论数据量有多大,充其量也就是一个大型的传统系统,而不是大数据系统。DAP通过针对性的挖掘算法改进,可以做出超越人类专家经验与直觉的智慧建议,提升人类活动准确性,提高社会生产能力。
第三点,DAP具备平台特性。DAP聚焦在数据的存储、处理时效、以及挖掘算法,为上层应用解决大数据应用的技术难点与障碍。上层应用可以根据自身的需求,快速地进行定制开发,以很短的时间周期与研发成本推出新的大数据应用。未来,DAP还可以对第三方开放,支撑第三方的大数据业务开发。
根据他的介绍,目前中兴的DAP大数据平台已经承载了电信、金融、政府相关领域的多个行业的大数据方案。
封闭研发很难成功
从技术的角度来看,陈坚认为,大数据平台在各个行业中是相似的,可以采用相近的技术框架与方案,然后针对不同的应用特点做针对性优化。大数据应用对于各个行业的差异性则是比较大的,需要适应行业应用的不同解决方案。
大数据作为一个产业链,任何封闭研发的尝试都是很难成功的。陈坚说,首先,大数据业务的实现天生具备定制化强的特点。所以,无论是电信、金融、还是其他领域,中兴通讯作为大数据技术的提供者,都必须与合作伙伴做紧密的配合,才有可能获得项目的成功。
其次,在大数据领域,中兴也在参与开源社区的工作,在为开源社区做贡献的同时,同时利用开源社区的智慧与资源。
而且,中兴通讯通过与北邮等高校的技术合作,开始做针对性的技术预研,论证未来技术实现的可行性。
对于一个大数据的系统,可以将其分成数据收集获取、存储计算、建模应用这三个层面。
在数据的收集获取方面,业主本身就是这些数据的拥有者,需要考虑的是大量的对接、测试、谈判等工作,这就需要业主自身具备较好的数据收集、谈判能力。作为技术提供者,中兴通讯具备数据的接入、清洗等相关技术,可以协助业主做大量的实际测试与对接工作。
在数据的存储计算方面,这往往是技术提供者最擅长的工作。对于中兴通讯来说,为了适应各个行业对大数据解决方案的需求,构建了公司级的DAP大数据平台,其所涉及的范畴正是数据的存储计算相关的领域。
在数据的建模应用方面,往往需要业主与技术提供者协作工作,才能取得较好的效果。业主拥有自己领域的专家,可以整理出本领域的需求,中兴的技术专家就可以根据这些需求,与业主进行协作,构建数据模型,完成新业务的开发。
综合而言,在构建大数据系统方案时,业主与技术提供者是天生且必须的合作关系。业主更擅长于数据采集获取、数据建模应用相关的工作,技术提供者更擅长于数据存储处理、数据建模应用相关的工作。
今天,大家都意识到大数据是和自然资源一样重要的战略资产,随着应用不断深入社会各个角落,大数据挖掘有可能会超越人类专家经验与直觉的智慧,势必会催生社会发展变革。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在 MySQL 实际应用中,“频繁写入同一表” 是常见场景 —— 如实时日志存储(用户操作日志、系统运行日志)、高频交易记录(支付 ...
2025-10-30为帮助教育工作者、研究者科学分析 “班级规模” 与 “平均成绩” 的关联关系,我将从相关系数的核心定义与类型切入,详解 “数 ...
2025-10-30对 CDA(Certified Data Analyst)数据分析师而言,“相关系数” 不是简单的数字计算,而是 “从业务问题出发,量化变量间关联强 ...
2025-10-30在构建前向神经网络(Feedforward Neural Network,简称 FNN)时,“隐藏层数目设多少?每个隐藏层该放多少个神经元?” 是每个 ...
2025-10-29这个问题切中了 Excel 用户的常见困惑 —— 将 “数据可视化工具” 与 “数据挖掘算法” 的功能边界混淆。核心结论是:Excel 透 ...
2025-10-29在 CDA(Certified Data Analyst)数据分析师的工作中,“多组数据差异验证” 是高频需求 —— 例如 “3 家门店的销售额是否有显 ...
2025-10-29在数据分析中,“正态分布” 是许多统计方法(如 t 检验、方差分析、线性回归)的核心假设 —— 数据符合正态分布时,统计检验的 ...
2025-10-28箱线图(Box Plot)作为展示数据分布的核心统计图表,能直观呈现数据的中位数、四分位数、离散程度与异常值,是质量控制、实验分 ...
2025-10-28在 CDA(Certified Data Analyst)数据分析师的工作中,“分类变量关联分析” 是高频需求 —— 例如 “用户性别是否影响支付方式 ...
2025-10-28在数据可视化领域,单一图表往往难以承载多维度信息 —— 力导向图擅长展现节点间的关联结构与空间分布,却无法直观呈现 “流量 ...
2025-10-27这个问题问到了 Tableau 中两个核心行级函数的经典组合,理解它能帮你快速实现 “相对位置占比” 的分析需求。“index ()/size ( ...
2025-10-27对 CDA(Certified Data Analyst)数据分析师而言,“假设检验” 绝非 “套用统计公式的机械操作”,而是 “将模糊的业务猜想转 ...
2025-10-27在数字化运营中,“凭感觉做决策” 早已成为过去式 —— 运营指标作为业务增长的 “晴雨表” 与 “导航仪”,直接决定了运营动作 ...
2025-10-24在卷积神经网络(CNN)的训练中,“卷积层(Conv)后是否添加归一化(如 BN、LN)和激活函数(如 ReLU、GELU)” 是每个开发者都 ...
2025-10-24在数据决策链条中,“统计分析” 是挖掘数据规律的核心,“可视化” 是呈现规律的桥梁 ——CDA(Certified Data Analyst)数据分 ...
2025-10-24在 “神经网络与卡尔曼滤波融合” 的理论基础上,Python 凭借其丰富的科学计算库(NumPy、FilterPy)、深度学习框架(PyTorch、T ...
2025-10-23在工业控制、自动驾驶、机器人导航、气象预测等领域,“状态估计” 是核心任务 —— 即从含噪声的观测数据中,精准推断系统的真 ...
2025-10-23在数据分析全流程中,“数据清洗” 恰似烹饪前的食材处理:若食材(数据)腐烂变质、混杂异物(脏数据),即便拥有精湛的烹饪技 ...
2025-10-23在人工智能领域,“大模型” 已成为近年来的热点标签:从参数超 1750 亿的 GPT-3,到万亿级参数的 PaLM,再到多模态大模型 GPT-4 ...
2025-10-22在 MySQL 数据库的日常运维与开发中,“更新数据是否会影响读数据” 是一个高频疑问。这个问题的答案并非简单的 “是” 或 “否 ...
2025-10-22