京公网安备 11010802034615号
经营许可证编号:京B2-20210330
作者 | 网络大数据
来源 | raincent_com
随着物联网的演变和发展,所有可以想象到的东西(或事物)和产业都将变得更加智能:智能家居和智慧城市、智能制造机械、智能汽车、智能健康等等。无数被授权收集和交换数据的东西正在形成一个全新的网络——物联网——一个可以在云中收集数据、传输数据和完成用户任务的物理对象网络。
物联网和大数据正在走向胜利之路。不过,要想从这一创新中获益,还需要解决一些挑战和问题。在本文中,我们很高兴与大家分享多年来在物联网咨询领域积累的知识。
物联网大数据如何应用
首先,有多种方法可以从物联网大数据中获益:在某些情况下,通过快速分析就足够了,而一些有价值的见解只有在经过深入的数据处理之后才能获得。
实时监测。通过连网设备收集的数据可以用于实时操作:测量家中或办公室的温度、跟踪身体活动(计算步数、监测运动)等;实时监测在医疗保健中被广泛应用(例如,获取心率、测量血压、糖分等);它还成功地应用于制造业(用于控制生产设备)、农业(用于监测牛和作物)和其他行业。
数据分析。在处理物联网生成的大数据时,我们有机会超越监测,并从这些数据中获得有价值的见解:识别趋势,揭示看不见的模式并找到隐藏的信息和相关性。
流程控制和优化。来自传感器的数据提供了额外的上下文情境信息,以揭示影响性能和优化流程的重要问题。
▲交通管理:跟踪不同日期和时间的交通负荷,以制定出针对交通优化的建议,例如,在特定时间段增加公共汽车的数量,看看是否有改观,以及建议引入新的交通信号灯方案和修建新的道路,以减少街道的交通拥堵状况。
▲零售:跟踪超市货架中商品的销售情况,并在商品快卖完之前及时通知工作人员补货。
▲农业:根据传感器的数据,在必要时给作物浇水。
预测性维护。通过连网设备收集的数据可以成为预测风险、主动识别潜在危险状况的可靠来源,例如:
▲医疗保健:监测患者健康状态并识别风险(例如,哪些患者有糖尿病、心脏病发作的风险),以便及时采取措施。
▲制造业:预测设备故障,以便在故障发生之前及时解决。
还应注意的是,并非所有的物联网解决方案都需要大数据(例如,如果智能家居拥有者要借助智能手机来关灯,则可以在没有大数据的情况下执行此操作)。重要的是要考虑减少处理动态数据的工作量,并避免存储将来没有用处的大量数据。
物联网中的大数据挑战
除非处理大量数据以获取有价值的见解,否则这些数据完全没用。此外,在数据收集、处理和存储方面还有各种挑战。
▲数据可靠性。虽然大数据永远不会100%准确,但在分析数据之前,请务必确保传感器工作正常,并且用于分析的数据质量可靠,且不会因各种因素(例如,机器运行的不利环境、传感器故障)而损坏。
▲要存储哪些数据。连网设备会产生万亿字节的数据,选择存储哪些数据和删除哪些数据是一项艰巨的任务。更重要的是,一些数据的价值还远远没有显现出来,但将来您可能需要这些数据。如果您决定为将来存储数据,那么面临的挑战就是以最小的成本做到这一点。
▲分析深度。一旦并非所有大数据都很重要,就会出现另一个挑战:什么时候快速分析就足够了,什么时候需要进行更深入的分析以带来更多价值。
▲安全。毫无疑问,各个领域的连网事物可以让我们的生活变得更加美好,但与此同时,数据安全也成一个非常重要的问题。网络罪犯可以侵入数据中心和设备,连接到交通系统、发电厂、工厂,并从电信运营商那里窃取个人数据。物联网大数据对于安全专家来说还是一个相对较新的现象,相关经验的缺失会增加安全风险。
物联网解决方案中的大数据处理
在物联网系统中,物联网体系架构的数据处理组件因输入数据的特性、预期结果等而不同。我们已经制定了一些方法来处理物联网解决方案中的大数据。
数据来自与事物相连的传感器。“事物”可以是任何物体:烤箱、汽车、飞机、建筑、工业机器、康复设备等。数据可以是周期性的,也可以是流式的。后者对于实时数据处理和迅速管理事物至关重要。
事物将数据发送到网关,以进行初始数据过滤和预处理,从而减少了传输到下一个物联网系统中的数据量。
边缘分析。在进行深入数据分析之前,有必要进行数据过滤和预处理,以选择某些任务所需的最相关数据。此外,此阶段还可以确保实时分析,以快速识别之前在云中通过深度分析所发现的有用模式。
对于基本协议转换和不同数据协议之间的通信,云网关是必需的。它还支持现场网关和中央物联网服务器之间的数据压缩和安全数据传输。
连网设备生成的数据以其自然格式存储在数据湖中。原始数据通过“流”进入数据湖。数据保存在数据湖中,直到可以用于业务目的。清理过的结构化数据存储在数据仓库中。
机器学习模块根据之前积累的历史数据生成模型。这些模型定期(例如,一个月一次)用新数据流更新。输入的数据被累积并应用于训练和创建新模型。当这些模型经过专家的测试和批准后,控制应用程序就可以使用它们,以响应新的传感器数据发送命令或警报。
总结
物联网产生大量数据,可用于实时监控、分析、流程优化和预测性维护等。然而,应该记住,从各种格式的海量数据中获得有价值的见解并不是一件容易事情:您需要确保传感器工作正常,数据得到安全传输和有效处理。此外,始终存在一个问题:哪些数据值得存储和处理。
尽管存在一些挑战和问题,但应记住,物联网的发展势头强劲,并可以帮助多个行业的企业开辟新的数字机遇。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
【核心关键词】软件、洞察力、大数据、产品、经验、硬件、流量、创新、决策、数据安全、网络安全、数据分析、决策制定、数据挖 ...
2026-06-18在方案选型、效果复盘、产品评估、供应商筛选等各类业务决策场景中,仅凭单一指标下结论往往会陷入 “以偏概全” 的误区。多维度 ...
2026-06-18 很多数据分析师精通Excel单元格操作,但当被问到“表结构数据的基本处理单位是什么”“字段和记录的本质区别”“为什么表结 ...
2026-06-18在数据分析、用户运营与业务增长的工作体系中,漏斗拆解是最基础也最高频的问题定位方法。很多业务场景下,我们只能看到最终的转 ...
2026-06-17在数据库开发、数据清洗与报表统计场景中,数值类型转换为日期是高频刚需操作。业务系统常以 Unix 时间戳、整型日期(如20240617 ...
2026-06-17 数据分析师八成以上的时间在和数据表格打交道,但许多人拿到Excel后习惯性地先算、先分析,结果回头发现漏了一列关键数据, ...
2026-06-17【核心关键词】数据库、电商、知识、产品、数据产品、监管业务、产品经理、业务系统、用户行为分析、用户分析、数据分析、电商 ...
2026-06-16在 Python 动态类型与面向对象的编程体系中,变量定义与类实例化是构建代码逻辑的两大核心基石。变量是数据存储、传递与运算的基 ...
2026-06-16 很多数据分析师每天与Excel打交道,但当被问到“表格结构数据和表结构数据有什么区别”“数据类型误判会引发哪些分析错误” ...
2026-06-16在 MySQL 查询性能优化体系中,索引是降低查询耗时、提升数据库吞吐的核心手段。其中联合索引与覆盖索引是实际开发中最高频的两 ...
2026-06-15在数据仓库建设与商业智能分析体系中,维度建模是应用最广泛的建模方法论,而事实表与维度表是维度建模的两大核心构件,共同构成 ...
2026-06-15 很多数据分析师能熟练计算指标,但当被问到“这家企业的核心业务目标是什么”“如何把模糊的战略目标拆解为可量化的指标”“ ...
2026-06-15在数据分析、业务监控、运营复盘等场景中,列值趋势计算是核心需求之一。无论是分析销售额的月度增长、用户活跃的变化趋势、库存 ...
2026-06-12在数字经济深度渗透的当下,消费者的购买行为已从过去的 “被动接受” 转变为 “主动决策”。流量红利消退、获客成本攀升、用户 ...
2026-06-12CDA三级认证是三个级别中的塔尖,全面考察数据战略、团队领导和复杂项目的综合能力。它所对应的《敏捷数据挖掘》教材,不再局限 ...
2026-06-12在游戏产业的商业逻辑中,付费玩家是支撑游戏生存与发展的核心支柱。行业普遍遵循 “二八定律”:20% 的付费玩家贡献了游戏 80% ...
2026-06-11【核心关键词】企业、定位、传统、产品、互联网、可视化、业务侧、数字化、结构化、数据分析、传统制造业、市场状态、发展空间 ...
2026-06-11 解读《CDA二级教材:量化策略分析(2025)》的全景结构与学习逻辑 ” CDA二级认证是企业招聘数据分析师时最常提及的证书门槛 ...
2026-06-11【核心关键词】药企、可视化、营销、分类、数据分析师、销售数据、业务人员、指导方向、分析报告、营销数据、营销医生 【专访摘 ...
2026-06-10在统计学分析、问卷调研、实验验证、业务复盘等场景中,卡方检验与 T 检验是应用最广泛的两类基础假设检验方法。前者专门处理分 ...
2026-06-10