京公网安备 11010802034615号
经营许可证编号:京B2-20210330
“互联网+”时代 工业如何拥抱大数据_数据分析师考试
随着互联网产业的蓬勃发展,越来越多的传统行业正在被互联网技术改变。当前,“软件定义世界、数据驱动世界、自动化接管世界”已成为产业共识,特别是伴随大数据、云计算、物联网技术的应用,“互联网+”时代已经扑面而来,拥抱互联网就是拥抱希望、拥抱未来。
而从早期的“鼠标加水泥”,再到当下的“互联网+”,工业领域从来未曾远离信息技术革命的每个阶段。尽管如此,工业领域对于信息浪潮下的数字化改造仍然焦虑不安,对于大数据、工业4.0、工业互联网以及智能制造等众多新概念仍然不知所措。不久前,中国工业大数据创新发展联盟专家委员会主任、工信部原副部长杨学山指出,工业大数据的主体是工业,不是大数据,大数据要为工业服务。
近日,在工业和信息化部软件服务业司、青岛市政府指导下,2015“互联网+”助推产业转型升级发展高峰论坛在青岛召开。此次论坛围绕着“互联网+”,就现代企业如何适应产业发展和变革,如何利用新一代信息技术拓展发展空间等进行了探讨。这些经验的相互启发和交流,对于企业明确未来发展目标,找准方法,推进实施产业转型升级,实现制造强国战略都具有重要而深远的意义。
从早期的“鼠标加水泥”,再到当下的“互联网+”,工业领域从来未曾远离信息技术革命的每个阶段。尽管如此,工业领域对于信息浪潮下的数字化改造仍然焦虑不安。
对此,中国工业大数据创新发展联盟专家委员会主任、工信部原副部长杨学山解释为“乱花渐入迷人眼”,是在面对“工业大数据”、“工业4.0”、“工业互联网”,以及“智能制造”、“网络制造”等众多新概念时的不知所措。
“工业大数据的主体是工业,不是大数据。大数据要为工业服务”。站在一个更加宏观的视角,杨学山指出,技术发展到今天,先进的技术力量已经足以推动工业发展的转型。持续了300多年的工业革命即将变轨,向新轨道行进已是不可变的过程。
此刻工业要做的不是破釜沉舟、惊险一跳,而是一定要“从昨天的基础上走向明天,这个道叉搬得越稳定越好”。
A大数据的基因
什么是工业大数据,维基百科给出的答案是,“庞大、结构复杂,难以通过现有IT技术与工具处理的数据集”。这种模糊的概念,也导致一百个人似乎有一百个答案。
在曙光信息产业股份有限公司总裁历军看来,大数据可能就是一本企业陈年老账。历军分享了一个令他感受颇深的案例。
一家美国高端摩托车制造商,因为其产品是奢侈品所以销售数量有限。不过,在分析了企业沉积的销售数据和几十年的客户信息之后,他们有了一个重要的发现,即“高档摩托车的客户,购买摩托车的冲动大概在24小时就结束了。”
于是这家企业围绕着这个发现,对生产模式进行了一番改造。他们要在24小时之内使消费者把冲动变为购买现实,不再流失任何一个潜在的客户。
企业首先是允许顾客在网上定制一个摩托车,用鼠标点击设定自己的喜好,包括颜色、发动机型号,等等。然后在完成付款6个小时之内,通过一个柔性化制造厂完成摩托车的生产,此后再经过12小时智能物流系统进行配送,最后会在24小时之内把这辆车送到用户的家门口,而且是全球范围。
“这似乎就是未来在新的工业4.0下新的高端制造、先进制造”,历军说到。工业大数据的价值正在显现,也有越来越多的企业嗅到了其中的巨大商机。据了解,目前曙光正在研究向客户赠送EB级存储的可行性,但前提是可以使用上面的数据。
作为国内为数不多拥有海量互联网数据的企业之一,百度也一直在尝试通过运用大数据的分析服务,与工业以及能源企业进行合作。
百度研究院大数据实验室科学家沈志勇以风机举例说到,通常风机都是安装在较远的地方,如果风机坏了,维修人员要用一天时间赶过去。设备坏了再修,一些物理系数可能难以挽回,所以这些情况下故障预警是非常重要的。
那么维修人员能不能预测故障的发生,提前一天就赶过去?沈志勇指出,实际上可以根据以前历史情况做出一个模型,以此判断风机发生故障的时间。如果这个故障在历史上发生次数越多,模型预测就会越准确。
这只是大数据在工业领域运用的一种尝试,此外类似的设备异常检测的例子,也可以通过大数据的变化捕捉出来,并且在预警故障上表现得会更加容易和积极。他表示,如果运用得当,以后类似“今年年初上海外滩发生的踩踏事件”在技术上完全可以预警并且避免。
B大数据的融合
“工业大数据是工业革命发展以来,在历史长河中一直存在和发展的。”杨学山说,“只是说我们今天有互联网、传感器,使得它对整个行业、企业发展的影响增加了。”杨学山认为,把工业大数据作为能够使企业和行业脱胎换骨的神丹妙药是错误的,这如同画饼充饥,“我可以坦率地说,画一百个这样的饼,有一个饼能落下来就不错了”。
在杨学山看来,不同的行业和领域,在整体技术成本进一步上升和社会各种原因的制约下,围绕着核心竞争力、前沿劳动生产力、质量、品牌等这样一些最关键问题,推动制造业一步步走向智能化的就是大数据。
杨学山说:“如何把工业大数据变成企业的创新能力才是最主要的环节,也是今天所有企业对数据利用最困难的环节,但当你一旦把这个数据变成创新能力的时候,我相信无论是在工业大数据、工业4.0,还是在智能制造方面,企业都已经站上了一个很高的台阶”。
中国是制造大国,但总体而言经过多年的发展,信息化和现代化的水平依旧不高,区域发展参差不齐,仍处于创新能力比较弱、全球产业链的中低端。中国的制造业急需摆脱低端化的羁绊,向拥有核心技术的以创新和质量双轮驱动的高端智能方向发展。那么,利用工业大数据促进传统工业与信息技术的深度融合是中国工业最为紧迫的任务。
中国电子学会秘书长、中国首席信息官联盟理事长兼秘书长徐晓兰指出,对于互联网与传统工业,每个国家都试图实现深度融合。如今制造业已成为全球竞争的制高点,美国提出了工业互联网概念,德国提出了工业4.0,相应的企业也在布局制造业的制高点。
中国制造要向中国智造发展,成为适应和引领经济新常态的根本要求,其中“制造”和“智造”难度是一样的。好在“中国制造2025”与“互联网+”的战略设计为制造业发展指明了方向。
徐晓兰表示,从制造大国向制造强国迈进,要依靠创新、绿色制造、强基工程、智能转型来驱动。大数据驱动中国特色的工业4.0,智能工业时代的来临也助推了工业大数据的应用,成为提升制造业的关键。
未来智能制造主要的特征是智能互联、人机互联、机器互联。当前人类社会是从IT时代进入到BT时代,未来要进入RT时代,就是机器人的时代,人与机器、机器与机器的互联互通,其中要有一个语境,这就是要建立大数据或者互联互通的标准和规范。
她指出,智能制造时代的到来,也意味着工业大数据时代的到来,工业大数据的应用,将成为未来提升制造业生产力、竞争力、创新能力的关键要素,也是目前全球工业转型必须面临的重大课题。
徐晓兰说:“建设中国特色的工业4.0,要解决企业对密集劳动力的过分依赖,降低从生产到销售终端全成本,需借助大数据等新技术推动企业转型,提升生产,制造全流程的数据可视化和透明度,实现生产、制造全流程质量管理,帮助企业更好地满足消费者的需求,就是说以后个性化和定制化的产品,会成为将来制造的主流,是在新一轮全球产业竞争中抢占先机的重要因素”。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在分类变量关联分析中(如 “吸烟与肺癌的关系”“性别与疾病发病率的关联”),卡方检验 P 值与 OR 值(比值比,Odds Ratio)是 ...
2025-11-05CDA 数据分析师的核心价值,不在于复杂的模型公式,而在于将数据转化为可落地的商业行动。脱离业务场景的分析只是 “纸上谈兵” ...
2025-11-05教材入口:https://edu.cda.cn/goods/show/3151 “纲举目张,执本末从。” 若想在数据分析领域有所收获,一套合适的学习教材至 ...
2025-11-05教材入口:https://edu.cda.cn/goods/show/3151 “纲举目张,执本末从。” 若想在数据分析领域有所收获,一套合适的学习教材至 ...
2025-11-04【2025最新版】CDA考试教材:CDA教材一级:商业数据分析(2025)__商业数据分析_cda教材_考试教材 (cdaglobal.com) ...
2025-11-04在数字化时代,数据挖掘不再是实验室里的技术探索,而是驱动商业决策的核心能力 —— 它能从海量数据中挖掘出 “降低成本、提升 ...
2025-11-04在 DDPM(Denoising Diffusion Probabilistic Models)训练过程中,开发者最常困惑的问题莫过于:“我的模型 loss 降到多少才算 ...
2025-11-04在 CDA(Certified Data Analyst)数据分析师的工作中,“无监督样本分组” 是高频需求 —— 例如 “将用户按行为特征分为高价值 ...
2025-11-04当沃尔玛数据分析师首次发现 “啤酒与尿布” 的高频共现规律时,他们揭开了数据挖掘最迷人的面纱 —— 那些隐藏在消费行为背后 ...
2025-11-03这个问题精准切中了配对样本统计检验的核心差异点,理解二者区别是避免统计方法误用的关键。核心结论是:stats.ttest_rel(配对 ...
2025-11-03在 CDA(Certified Data Analyst)数据分析师的工作中,“高维数据的潜在规律挖掘” 是进阶需求 —— 例如用户行为包含 “浏览次 ...
2025-11-03在 MySQL 数据查询中,“按顺序计数” 是高频需求 —— 例如 “统计近 7 天每日订单量”“按用户 ID 顺序展示消费记录”“按产品 ...
2025-10-31在数据分析中,“累计百分比” 是衡量 “部分与整体关系” 的核心指标 —— 它通过 “逐步累加的占比”,直观呈现数据的分布特征 ...
2025-10-31在 CDA(Certified Data Analyst)数据分析师的工作中,“二分类预测” 是高频需求 —— 例如 “预测用户是否会流失”“判断客户 ...
2025-10-31在 MySQL 实际应用中,“频繁写入同一表” 是常见场景 —— 如实时日志存储(用户操作日志、系统运行日志)、高频交易记录(支付 ...
2025-10-30为帮助教育工作者、研究者科学分析 “班级规模” 与 “平均成绩” 的关联关系,我将从相关系数的核心定义与类型切入,详解 “数 ...
2025-10-30对 CDA(Certified Data Analyst)数据分析师而言,“相关系数” 不是简单的数字计算,而是 “从业务问题出发,量化变量间关联强 ...
2025-10-30在构建前向神经网络(Feedforward Neural Network,简称 FNN)时,“隐藏层数目设多少?每个隐藏层该放多少个神经元?” 是每个 ...
2025-10-29这个问题切中了 Excel 用户的常见困惑 —— 将 “数据可视化工具” 与 “数据挖掘算法” 的功能边界混淆。核心结论是:Excel 透 ...
2025-10-29在 CDA(Certified Data Analyst)数据分析师的工作中,“多组数据差异验证” 是高频需求 —— 例如 “3 家门店的销售额是否有显 ...
2025-10-29