京公网安备 11010802034615号
经营许可证编号:京B2-20210330
民机客服工程的大数据应用
大数据技术正深刻影响着民机产业链的上下游,工业大数据缘起国外,在民机领域大数据应用发展较快,而在国内民机客服工程领域也有所突破。
大数据属于数量大 (Volume)、输入和处理速度快 (Velocity)、数据多样性 (Variety)和价值密度低 (Value) 的复杂、海量信息,无法用传统工具处理分析。大数据可分为三类:一是社交类数据,记录用户行为、反馈数据等;二是商业类数据,包括消费者数据、ERP数据、库存数据以及账目数据等;三是工业类数据,又称机器和传感器数据,包括智能仪表、工业设备传感器、呼叫记录、设备日志等。
目前工业大数据形成了以“工业互联网”为代表的美国模式、“工业4.0”为代表的德国模式和“两化融合”、“互联网 ”为代表的中国模式。
工业大数据作为大数据体系的分支,与其既有共通性,又有特殊性。在共通性方面,都是基于海量数据、分析技术和大数据思维三要素,"数据分析师"以预测为核心,以模型和算法为关键。
客服工程数字化的内在驱动是大数据
当前的民用客机研制不但在传统工程技术体系内追求突破创新,更注重从服务客户角度对产品设计方案实施再开发,即“民机客服工程”。客服工程是对产品定义的开发补充,是对产品使用性能的技术创意,它把产品操作和维修等固有特性转化为外在表现,从而构建起产品全生命周期持续安全健康运行的基础。从技术角度看,民机客服工程更多地使用数理统计和逻辑判断工具,更注重大数据在飞行效率、健康管理等领域的应用。
大数据应用的关键技术分析
数据分析师从数据源获取到产生最终价值,一般经过数据的采集准备、存储管理、计算处理、数据分析和知识展现等五个主要环节。相对于传统挖掘技术,大数据分析的技术突破主要集中在存储管理、计算处理和数据分析三个核心环节。在民机应用方面,又涉及工业物联网、航空电信网等关键技术。
"数据分析师"面对海量数据,传统存储技术一方面是存储和计算物理分离、易受I/O瓶颈制约,另一方面是数据数据冗余、扩展、容错和并发读写能力不足。谷歌文件系统(GFS)和Hadoop分布式文件系统(HDFS)在物理上将计算和存储节点结合在一起,避免了数据密集计算时的I/O堵塞;采取分布式存储架构,以提高并发访问能力,在大文件存储上的表现优异。随着应用和需求的发展,内存型数据库在提高随机、海量小文件频繁读写方面表现优异。
传统关系型数据库采取结构化数据管理方式,优点是数据一致性强,缺点是容差性、并发性较弱。谷歌Big Table和HadoopHBase等新型非关系数据库(NoSQL)通过“键-值”(Key-Value)对、文件等非二维表,提供了处理多源多类非结构化数据的解决方案,由于只关注结果一致性,不追求过程一致性,效率也充分提升。谷歌推出Spanner数据库,可在全球部署100万~1000万台服务器的超大存储系统,通过原子钟进行全局精确同步,在非关系型数据库基础上实现一致性,同时还支持SQL接口,体现两种数据管理技术融合发展的方向。
并行计算关键技术
传统高性能计算的特点是“数据简单、算法复杂”,大数据是典型的数据密集型计算,更重视计算单元和存储单元间的吞吐率。谷歌的MapReduce并行计算技术,通过廉价通用服务器组建系统、添加服务器节点线性扩展系统处理能力,成为应用最为广泛的大数据计算平台。基于MapReduce,业界又发展出多种并行计算技术:一是“边到达边计算”的流计算,如Yahoo的S4和Twitter的Storm;二是针对大规模图数据进行优化的图计算,如谷歌的Pregel;三是将MapReduce内存化以提高实时性的内存批计算, Spark;四是可秒级处理PB级数据的快速交互分析,如谷歌的Dremel。2013年,Hadoop社区推出的将任务调度和资源管理分离、适合多种计算模型的通用MapReduce架构YARN,现已发展成为大数据计算平台的公认标准。
大数据分析技术路线先凭借先验知识人工建立数学模型分析、而后通过大量样本数据进行机器学习。2006 年,谷歌等公司提出增加人工神经网络层数和神经元节点数量,构建深度神经网络以提高训练效果,并在后续试验中得到证实。基于深度神经网络的机器学习技术在语音识别和图像识别等方面取得了较好效果。
工业物联网
工业大数据离不开工业物联网的支撑。第一代工业物联网以模拟信号单向传递为主,布线复杂、抗干扰性差。第二代工业物联网以数字分布式控制系统为代表,信号精度提高但网络实时性和稳定性不足。第三代工业物联网突出现场总线控制,采用全数字、开放式双向通信网络将各控制器与设备互连,而更为便捷、低廉的工业以太网已开始取代现场总线技术。第四代工业物联网的特点是无线传感和通信,突破传统分层控制体系,形成制造、管理、分析、服务的全网一体化架构,同时还具备现场设备感知、实时微处理微计算、微秒级快速响应和复杂环境下稳定传输等能力。
航空电信网
航空电信网(ATN )是基于国际标准公共接口服务和协议,集成地面、地空和航空等多种数据子网,以实现统一数据传输服务的全球空地一体化航空专用通信网络。ATN最大的转变是从面向字符传输到面向比特传输,是未来实现航空大数据实时分析的基础通信保障。ATN主要由通信子网、ATN路由器和终端系统组成。其中ATN通信子网一般由机上子网、空地子网(如甚高频地空数据链、二次雷达S模式、 卫星通信、高频地空数据链等)和地面子网三种形式的数据通信网络组成。而ATN异质网际间的数据传输,则由ATN路由器实现。cda数据分析师培训
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
【核心关键词】软件、洞察力、大数据、产品、经验、硬件、流量、创新、决策、数据安全、网络安全、数据分析、决策制定、数据挖 ...
2026-06-18在方案选型、效果复盘、产品评估、供应商筛选等各类业务决策场景中,仅凭单一指标下结论往往会陷入 “以偏概全” 的误区。多维度 ...
2026-06-18 很多数据分析师精通Excel单元格操作,但当被问到“表结构数据的基本处理单位是什么”“字段和记录的本质区别”“为什么表结 ...
2026-06-18在数据分析、用户运营与业务增长的工作体系中,漏斗拆解是最基础也最高频的问题定位方法。很多业务场景下,我们只能看到最终的转 ...
2026-06-17在数据库开发、数据清洗与报表统计场景中,数值类型转换为日期是高频刚需操作。业务系统常以 Unix 时间戳、整型日期(如20240617 ...
2026-06-17 数据分析师八成以上的时间在和数据表格打交道,但许多人拿到Excel后习惯性地先算、先分析,结果回头发现漏了一列关键数据, ...
2026-06-17【核心关键词】数据库、电商、知识、产品、数据产品、监管业务、产品经理、业务系统、用户行为分析、用户分析、数据分析、电商 ...
2026-06-16在 Python 动态类型与面向对象的编程体系中,变量定义与类实例化是构建代码逻辑的两大核心基石。变量是数据存储、传递与运算的基 ...
2026-06-16 很多数据分析师每天与Excel打交道,但当被问到“表格结构数据和表结构数据有什么区别”“数据类型误判会引发哪些分析错误” ...
2026-06-16在 MySQL 查询性能优化体系中,索引是降低查询耗时、提升数据库吞吐的核心手段。其中联合索引与覆盖索引是实际开发中最高频的两 ...
2026-06-15在数据仓库建设与商业智能分析体系中,维度建模是应用最广泛的建模方法论,而事实表与维度表是维度建模的两大核心构件,共同构成 ...
2026-06-15 很多数据分析师能熟练计算指标,但当被问到“这家企业的核心业务目标是什么”“如何把模糊的战略目标拆解为可量化的指标”“ ...
2026-06-15在数据分析、业务监控、运营复盘等场景中,列值趋势计算是核心需求之一。无论是分析销售额的月度增长、用户活跃的变化趋势、库存 ...
2026-06-12在数字经济深度渗透的当下,消费者的购买行为已从过去的 “被动接受” 转变为 “主动决策”。流量红利消退、获客成本攀升、用户 ...
2026-06-12CDA三级认证是三个级别中的塔尖,全面考察数据战略、团队领导和复杂项目的综合能力。它所对应的《敏捷数据挖掘》教材,不再局限 ...
2026-06-12在游戏产业的商业逻辑中,付费玩家是支撑游戏生存与发展的核心支柱。行业普遍遵循 “二八定律”:20% 的付费玩家贡献了游戏 80% ...
2026-06-11【核心关键词】企业、定位、传统、产品、互联网、可视化、业务侧、数字化、结构化、数据分析、传统制造业、市场状态、发展空间 ...
2026-06-11 解读《CDA二级教材:量化策略分析(2025)》的全景结构与学习逻辑 ” CDA二级认证是企业招聘数据分析师时最常提及的证书门槛 ...
2026-06-11【核心关键词】药企、可视化、营销、分类、数据分析师、销售数据、业务人员、指导方向、分析报告、营销数据、营销医生 【专访摘 ...
2026-06-10在统计学分析、问卷调研、实验验证、业务复盘等场景中,卡方检验与 T 检验是应用最广泛的两类基础假设检验方法。前者专门处理分 ...
2026-06-10