
大数据与分析是企业创新的核心
在全球的IT发展上,大数据这个领域是最活跃的领域。IBM正在加速向大数据方向转型。“IBM大中华区大数据与分析事业部总经理钟泽敏在最近的媒体沟通会上谈及年初成立了大数据分析事业部的初衷。他表示,IBM此次全球性的调整是根据市场大数据分析做的,把不同的部门重新放在同一个地方。这样对客户的需求反应更快,更合理。另外,他介绍,数据分析部门,主要分三块,一是数据分析的平台。二是解决方案。大数据分析未来发展的方向是以行业为主导的。三是包括行业专家和云服务,包括软件功能、云服务战略、服务团队和市场推广。
在谈及IBM在大数据领域的优势时,钟泽敏认为,IBM比其他公司比较有利的地方,是在于我们对未来市场需求的看法在转变。比如,IBM最近宣布与美国的的Weather company达成合作,通过天气的分析为各行业的商家提供预测的商业数据。
“多年来,IBM在市场上其实最多的积累就是客户的积累,对于各行各业的了解非常深刻,从产品部门到服务部门,对国内的银行、电信、政府、制造、医疗等等各个行业都做过大量的项目,了解客户的业务流程。真正要做到企业级,还是要对企业的业务进行了解,这是IBM的优势。”
认识大数据的两大误区
当我们谈论大数据时往往会形成很多的误区,IBM大中华区大数据与分析事业部数据平台方案总经理刘胜利认为,Hadoop系统的确是大数据有代表性的平台,但是大数据并不等于Hadoop。近2年Spark很热门,是大数据非常火的平台,但是也不意味着大数据就是Spark。
IBM非常强调大数据的分析和挖掘能力,数据多并不是价值,只有把数据里面的商业流程挖掘出来才是大数据的价值。
“一两个抽样数据拿出来,,这不叫大数据。” 刘胜利表示,抽样数据是典型的在计算机产生之前就存在的抽样调查,美国总统选举前做抽样调查,数百年前就已经存在了。
企业级挖掘大数据的价值
毋庸置疑,大数据是当前的潮流,在互联网的应用层出不穷,企业管理决策也越来越受预测性分析和大数据分析的影响,依靠直觉做决定的情况将会被彻底改变。那么,企业级的客户会关心如何应用技术来实现创新?会关心用应用大数据分析系统以后,如何实现高可用性、稳定性、可靠性?
开源可以解决一些问题吗?“开源里面没有一个正式的支持体系,刘胜利认为,太开放了,里面很新,匹配性做得不一定好,这需要做开源的人要有非常高的水平。” “国内能够用开源的这些代码去开发,做二次开发和支撑的企业级用户,不超过10家。刘胜利认为,因为企业的核心竞争力不在IT上,企业的精力应该在核心应用,而不是花大量的时间研究开源。他表示,开源是一件好事,但是对于企业级来讲要打一个问号,要慎重的考虑是不是要用开源,要养最少10个人的团队去做。
刘胜利表示,“IBM在大数据的领域的策略是把大数据应用于企业级。IBM在全球100多年的历史,一直把自己的策略定位为服务于企业级的客户,帮助他们提高竞争力,帮助他们去挣钱。”
企业使用大数据和互联网的企业使用大数据显然有非常明显的不一样,企业级的客户非常关注流程。刘胜利解释,“就是说大数据来了,企业原有的业务流程需要整合。会关注数据的挖掘,而不是堆积数据。更重要的是如何用大数据,不是说技术如何先进,而是技术对于行业创新有什么样的帮助,这是客户最关注的核心。”
“IBM非常强调大数据的分析和挖掘能力,数据多并不是价值,只有把数据里面的商业流程挖掘出来才是大数据的价值。” 刘胜利这样认为。IBM在美国,跟Facebook、Twitter开展战略合作,针对大量的社交数据,帮助企业用户勾勒一个客户360度的视图,做更好、更精准的营销。
流,大数据的热门技术
流是当前大数据当中的一个热门的技术。在9•11之后IBM最早做出来,就是把当前摄像信息、录像信息、监控信息抓出来,能够快速分析、及时预警。目前已经进行了商业化,变成了所谓的流技术。
流可以做什么?刘胜利举三个例子。天气预报的瞬间变换数据采集量非常大,IBM在国内某一个大的河流流域帮助做天气预报的预测,以便于做水力发电和流域自然环境的控制。在航空领域实施流的解决方案。大家一上飞机,空姐就拿上来一张报纸说你是我们的什么客户,送你一张报纸,或者你想吃什么餐。这觉得挺平常的服务,其实背后是采用流计算技术,针对进行毫秒级处理,实时拿到VIP客户的名单。更关键的不光是对于旅客的服务,飞机本身实时数据的监控处理数据量非常大,飞机在飞行过程当中,飞机本身以及飞机相关的各种子系统,和外界交流的这种控制系统产生了大量的信息,这些信息被送到流处理的系统,非常实时的处理,另外,在公共场所、重大节日,一些公园,通过流技术实时采集人流的手机移动信息进行人流监控方面。
“IBM做出来这样的产品,能够迅速把大数据平台搭建起来,聚焦在做行业的应用,做大数据的业务流程改造以及业务的创新,而不是很细节的这些某个产品的技术。”刘胜利表示,“这就是IBM希望做到的,而且已经帮助企业做到的技术。”
IBM的大数据分析产品SPSS
IBM很关注大数据分析,刘胜利认为“IBM关注的是大数据之下的分析,强调的重点是在分析、挖掘、预测。”
他介绍,大数据分析和挖掘用SPSS产品是非常有效的,包括对于客户的保留,同时针对本身的一些运营计划、门类、销售种类、销售预测等等,做到很细节的分析。
对于机器和设备的挖掘也是在广泛使用。在一些产品的制造过程中都会产生次品,这些分析挖掘,及早发现问题,也有利于这些次品早下线,让企业降低生产成本。这是一个制造业的例子,也会广泛的应用到新一代的智能制造当中。保险行业当中,包括客户投诉等等也是广泛应用的。
大数据分析应用于物联网
互联网+是传统行业和互联网的渗透,互相提升。“谈到互联网+概念,其实在所有的概念里面,在所有的战略、方针和趋势当中讨论的是一个核心的技术基础。” IBM大中华区大数据分析事业部行业解决方案总经理刘咏梅认为,是物联网。她介绍,物联网发展重要的趋势就是两化融合就是信息化和工业化的融合。就是因为从信息化的角度和工业化的角度不融合,达不到提高层次,达不到去创新。随着工业4.0 和中国制造2025的发展,会真正加快两化融合的脚步,或者说真正能够从一定程度上实现两化融合。
IBM的物联网是万物互联,强调一个新的生态系统,IBM大中华区大数据与分析事业部市场总监孙丽军认为,“没有任何一个人能够在外部互联中独自完成任务,只有在生态链才能共同完成IoT。”
中国制造2025比较着重于在工业领域、制造领域、消费电子领域等的拓展。刘咏梅认为,中国制造2025或是智能制造,应该是以物联网为基础在某些行业的实践。这么去定位它们之间相互的关系。
IBM在全球是跟其他非常多的相关领域的领导者或者公司在物联网的研究、创新和实践联盟组织中占了非常重要的位置。刘咏梅介绍,在业界有一个工业4.0平台组织,IBM是非常关键的一个组织成员,拥有智慧工厂研究平台,智慧的数据创新实验室和工业互联网联盟。在这个平台贡献想法,交流创新,把自己的想法通过不同的方式去落地和实践,这就是一个组织要去做的事情。
刘咏梅通过某品牌汽车研究汽缸的零件的具体案例,来介绍IBM大数据分析在物联网应用。有两个生产线,其中一条的次品率比别的次品率高。大家都在一个地方,怎么它的次品率就比别的高呢?于是IBM抓取了非常多的历史基础数据,包含环境的数据。最后发现,这个生产线在下午两点的次品率比较高。这是什么原因呢?是因为阳光照射进来温度会高,零件生产之后是液体的应在30秒内固化,因为受温度的影响,这个零件会发脆,严重影响生产。刘咏梅表示,在生产过程当中IBM提供相应的大数据解决方案,在工业4.0和物联网充分释放价值。
大数据分析给生产制造行业带来的价值。在中国怎么往前走?刘咏梅认为,“其实在过程中是不断演进的,要边学习、边研究、边探讨。”她介绍目前普遍认知的过程是,第一阶段,把智能工厂做起来,接下来,把智能工厂和相应的供应链集成在一起,最后,把多个供应链集成在一起。
“在整个打通合作链的过程当中,IBM都有相应的解决方案帮助客户去做。” 刘咏梅认为,在这个场景中进行协同合作,从而进行创新,提升竞争力。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
机器学习解决实际问题的核心关键:从业务到落地的全流程解析 在人工智能技术落地的浪潮中,机器学习作为核心工具,已广泛应用于 ...
2025-09-09SPSS 编码状态区域中 Unicode 的功能与价值解析 在 SPSS(Statistical Product and Service Solutions,统计产品与服务解决方案 ...
2025-09-09CDA 数据分析师:驾驭商业数据分析流程的核心力量 在商业决策从 “经验驱动” 向 “数据驱动” 转型的过程中,商业数据分析总体 ...
2025-09-09R 语言:数据科学与科研领域的核心工具及优势解析 一、引言 在数据驱动决策的时代,无论是科研人员验证实验假设(如前文中的 T ...
2025-09-08T 检验在假设检验中的应用与实践 一、引言 在科研数据分析、医学实验验证、经济指标对比等领域,常常需要判断 “样本间的差异是 ...
2025-09-08在商业竞争日益激烈的当下,“用数据说话” 已从企业的 “加分项” 变为 “生存必需”。然而,零散的数据分析无法持续为业务赋能 ...
2025-09-08随机森林算法的核心特点:原理、优势与应用解析 在机器学习领域,随机森林(Random Forest)作为集成学习(Ensemble Learning) ...
2025-09-05Excel 区域名定义:从基础到进阶的高效应用指南 在 Excel 数据处理中,频繁引用单元格区域(如A2:A100、B3:D20)不仅容易出错, ...
2025-09-05CDA 数据分析师:以六大分析方法构建数据驱动业务的核心能力 在数据驱动决策成为企业共识的当下,CDA(Certified Data Analyst) ...
2025-09-05SQL 日期截取:从基础方法到业务实战的全维度解析 在数据处理与业务分析中,日期数据是连接 “业务行为” 与 “时间维度” 的核 ...
2025-09-04在卷积神经网络(CNN)的发展历程中,解决 “梯度消失”“特征复用不足”“模型参数冗余” 一直是核心命题。2017 年提出的密集连 ...
2025-09-04CDA 数据分析师:驾驭数据范式,释放数据价值 在数字化转型浪潮席卷全球的当下,数据已成为企业核心生产要素。而 CDA(Certified ...
2025-09-04K-Means 聚类:无监督学习中数据分群的核心算法 在数据分析领域,当我们面对海量无标签数据(如用户行为记录、商品属性数据、图 ...
2025-09-03特征值、特征向量与主成分:数据降维背后的线性代数逻辑 在机器学习、数据分析与信号处理领域,“降维” 是破解高维数据复杂性的 ...
2025-09-03CDA 数据分析师与数据分析:解锁数据价值的关键 在数字经济高速发展的今天,数据已成为企业核心资产与社会发展的重要驱动力。无 ...
2025-09-03解析 loss.backward ():深度学习中梯度汇总与同步的自动触发核心 在深度学习模型训练流程中,loss.backward()是连接 “前向计算 ...
2025-09-02要解答 “画 K-S 图时横轴是等距还是等频” 的问题,需先明确 K-S 图的核心用途(检验样本分布与理论分布的一致性),再结合横轴 ...
2025-09-02CDA 数据分析师:助力企业破解数据需求与数据分析需求难题 在数字化浪潮席卷全球的当下,数据已成为企业核心战略资产。无论是市 ...
2025-09-02Power BI 度量值实战:基于每月收入与税金占比计算累计税金分摊金额 在企业财务分析中,税金分摊是成本核算与利润统计的核心环节 ...
2025-09-01巧用 ALTER TABLE rent ADD INDEX:租房系统数据库性能优化实践 在租房管理系统中,rent表是核心业务表之一,通常存储租赁订单信 ...
2025-09-01