
作者 | Alexander Felfernig, Seda Polat Erdeniz
编译 | CDA数据科学研究院
Recommender systems in the Internet of Things
物联网是一种联网的基础架构,是物联网、互联网和语义学领域之间融合的结果,为随时随地连接不同设备提供了基础。在物联网场景中,开发了大量的服务和应用程序,这使识别相关的服务和应用程序成为用户的一项复杂任务。在这种情况下,推荐系统便成了一项关键的技术,这些技术使大部分服务和应用程序的识别变得可行。比如在物联网等场景下可以在网关上安装一些应用程序,附加设备由网关部署和管理,同时在公共显示器上显示的信息文本,会被用于在网关上完成特定任务相关的数据传输协议,并应包括IoT相关场景中相关的硬件和软件组件。
推荐技术在IoT上下文中的进一步应用包括工作流程的推荐(例如,应将哪些软件功能包含在IoT应用程序的工作流程定义中),食品的推荐(例如,根据食品的状况,可以调整提供条件),在个性化店内购物场景中进行推荐(例如,根据实体店中顾客的位置,应推荐哪些商品)以及健康监控(例如,根据一个人当前的饮食行为和身体状况,推荐食物和体育锻炼)。在许多情况下,灵活的物联网网关基础设施都扮演着核心角色。
IoT网关是基于硬件和软件的解决方案,其主要作用是实现设备到设备中心/或设备到云的通信。它是一个平台,用于支持不同数据源(具有各种通信协议的传感器)与目的地(本地或远程数据管理实体以及各种执行器)之间的连接。物联网网关位于设备的边缘和附近,也可能在服务执行中发挥关键作用。典型的物联网网关平台由设备管理器,通信/数据协议管理器,应用程序管理器和数据管理器组成(请参见下图)。先进的IoT网关包含其他功能,其中可以包括配置器和推荐器引擎,以帮助用户配置网关或基于给定的网关设置和用户交互协议推荐有用的应用程序。
如图1所示,可以使用5G,BLE,LORA和ZigBee等各种连接协议将IoT传感器连接到IoT网关。网关用户可以通过WAN / LAN连接其网关,以管理或监视其数据和服务。他们还可以通过将云应用程序与其IoT网关链接来管理或监视收集的数据。
推荐技术可用于多种目的,以支持不同的物联网场景。在本节中,我们将会介绍协同过滤,基于内容的过滤,基于知识的推荐和组合推荐这四项基本推荐技术,如何根据不同场景去实现推荐的功能。
基于“口口相传”的想法,即朋友(最近邻居– NN)对物品的意见或看法被用作计算推荐算法的主要信息来源。然后,使用k个最近邻居的偏好(等级)来推断当前用户的偏好。例如,将安装在与当前用户具有类似应用程序库的用户的网关上的应用程序,安装在当前用户的网关上。物联网环境中协同过滤的其他应用示例是物联网环境提升中的设备推荐和组件部分推荐。支持协同过滤的不同场景的推荐库的示例是Apache Mahout。
表1:根据其他网关的安装信息,基于协同筛选的设备(d1..d4)和应用程序(app1..app4)推荐。与本地网关相比,网关1的配置文件是最相似的配置文件。由于app3未安装在本地网关上,因此可以将其解释为推荐候选。推荐的应用程序用√表示。
基于稳定的首选项的想法,即过去的首选项在将来不会发生重大变化。使用基于内容的过滤时,有关物品的基于关键字的信息与从当前用户过去已经消费过的项目中提取的关键字匹配。例如,如果用户安装了特定的应用程序,则可以在可用时推荐类似的应用程序或对现有应用程序的更新。在IoT上下文中应用基于内容筛选的其他示例是设备和工作流程的推荐。支持基于内容过滤的不同场景的推荐库示例是Apache Lucene。
表2:使用本地网关上已安装的应用程序的关键字(key)对应用程序进行基于内容过滤的推荐。与本地网关的配置文件相比,app1的关键字是最相似的关键字。由于app1未安装在本地网关上(假设),因此可以将其选择为推荐候选。推荐的应用程序用√表示。
基于使用以显式方式(即在规则约束方面)定义的推荐知识的思想。使用基于知识的推荐时,当前用户明确定义的首选项将转发到知识库,该知识库用于确定推荐(搜索问题的解决方案)。例如,如果IoT网关解决方案的用户更喜欢节电的网关配置,则与其他协议相比,将首选使用特定的通信协议。在物联网环境中,应用基于知识的推荐技术的其他示例包括整个网关配置的推荐,以及野生动物监测中数据收集策略的推荐。
基于组的推荐系统,是基于对用户小组的偏好,使用不同算法的汇总结果去推荐。在基于算法集成的推荐中,基本算法(例如协同过滤,基于内容的过滤和基于知识的推荐)用于确定针对单个用户的推荐。然后将这些建议汇总为该组的最终推荐(基于汇总预测的方法)。相关聚合函数的示例是平均值(推荐用户评分平均值最高的商品)和风险最少(推荐所有最低评分指标最高的商品)。另外,小组资料可以从小组成员的个人偏好中得出(*基于聚合模型的方法,根据小组资料,可以使用上述基本方法确定推荐。团体推荐系统的实现通常基于单用户推荐系统的库,也就是上述提到的Apache Mahout、Apache Lucene等。
本文讨论的推荐方法使用了不同的知识来源,并且还具有不同的优点,这些优点使它们(或更少)适用于特定的推荐方案。在下文中,我们将简单讨论推荐算法选择的主要标准,并针对这些标准分析所讨论的每种算法。
基于内容的筛选和基于协同的筛选的原理都比较简单,实现方式也比较快,只需获得有关评分方面的用户偏好的知识(在基于内容的过滤中,自动提取的关键字)就可以得出推荐。由于基于组的推荐系统大部分是使用这些基本算法,所以基于组的推荐系统的实现也比较容易。相比之下,基于知识的推荐方法需要更多的设置投资,由于领域专家和知识工程师之间的通信开销,知识库的构建通常是一个容易出错且繁琐的过程。
在推荐复杂的产品和服务时,主要支持在用户和系统之间进行对话的会话方法。在这种情况下,使用基于知识的推荐器,即在基于知识的推荐的上下文中支持对话方法。协同过滤和基于内容的过滤不支持推荐对话框。在小组推荐系统的背景下,由于部分小组推荐系统是基于知识的推荐,因此可以支持会话过程。
协同过滤和基于内容的推荐有较好的适应性,因为每一个新的等级更高程度的适应性可以改变推荐的项目清单。如果将协同过滤或基于内容的推荐用作基础推荐,这也适用于组推荐方案方法。基于知识的推荐方法显示出较低的适应性,因为知识库是比较稳定的,因为单个用户的偏好习惯不会一时间去改变。
如果用户喜欢某项推荐,并同时对此推荐感到完全出乎意料,就会产生惊喜度,一般这种效果主要可以通过协同推荐方法来实现。基于内容的推荐一般会假定其偏好保持稳定,并在已经购买的商品列表中提供建议。因此,这种方法提供了非常低的偶然性。同时,基于知识的推荐算法中的偶然性程度取决于编码的偶然性程度。基于小组推荐中的偶然性程度取决于所选择的基础基本推荐方法。
协同过滤和基于内容的过滤都存在冷启动问题:如果在协同过滤中没有特定用户的用户评级,或者到目前为止,当使用基于内容的推荐系统时用户没有购买任何商品时,也就是无法获取相似的推荐。此外,如果某个商品没有获得评级,则协同过滤系统很难将其考虑在内。由于基于内容的过滤基于商品的关键字,因此即使没有商品的评级也可以进行推荐。基于知识的推荐不存在冷启动问题,因为推荐知识被编码在一个知识库中,且假定该知识库在可以开始推荐会话之前就已经存在。
透明度可以视为推荐结果可解释的程度。协同过滤和基于内容的过滤中的结果具有较低的解释性,因为如果要解释的话,只能基于内容的推荐中的相似邻居和相似关键字。在基于知识的推荐中,可以更细化解释。相关说明可以考虑推荐的原因(由用户偏好列表表示),但也可以考虑为什么找不到解决方案以及哪些偏好矛盾的原因。在小组推荐系统中,可解释性取决于所选的基本推荐方法。
由于次优决策的负面影响很大,因此在大多数情况下,此类商品非常复杂,并且需要做出相关决策。其示例是选择特定的服务器基础结构或智能家居解决方案。相反,低参与度商品的例子是低价应用程序或传感器。在大多数情况下,基于知识的方法用于推荐高参与度的商品,而基于内容的协作过滤则用于推荐低参与度的商品。按照先前的论点,如果选择的基本推荐方法是基于知识的,则可以将小组推荐系统用于高度参与的商品。
在本文中,我们提供了对现有推荐方法的简短概述,并讨论了它们在物联网场景中的应用的不同方面。在这种情况下,我们还针对可用于选择推荐算法的一组标准讨论了不同方法的优缺点。同时,也有一些与推荐技术在物联网场景中的应用有关的开放研究问题需要我们关注,尤其是在推荐复杂的IoT配置的情况下,必须开发搜索机制,以便在面对庞大而复杂的配置知识库时也可以进行高效且个性化的解决方案搜索。此外,必须以有效的方式测试和更新有关产品可变性的知识。这项要求与软件工程的当前发展相吻合,后者在开发,测试,部署和生产使用之间相继实现了强大的耦合。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
机器学习解决实际问题的核心关键:从业务到落地的全流程解析 在人工智能技术落地的浪潮中,机器学习作为核心工具,已广泛应用于 ...
2025-09-09SPSS 编码状态区域中 Unicode 的功能与价值解析 在 SPSS(Statistical Product and Service Solutions,统计产品与服务解决方案 ...
2025-09-09CDA 数据分析师:驾驭商业数据分析流程的核心力量 在商业决策从 “经验驱动” 向 “数据驱动” 转型的过程中,商业数据分析总体 ...
2025-09-09R 语言:数据科学与科研领域的核心工具及优势解析 一、引言 在数据驱动决策的时代,无论是科研人员验证实验假设(如前文中的 T ...
2025-09-08T 检验在假设检验中的应用与实践 一、引言 在科研数据分析、医学实验验证、经济指标对比等领域,常常需要判断 “样本间的差异是 ...
2025-09-08在商业竞争日益激烈的当下,“用数据说话” 已从企业的 “加分项” 变为 “生存必需”。然而,零散的数据分析无法持续为业务赋能 ...
2025-09-08随机森林算法的核心特点:原理、优势与应用解析 在机器学习领域,随机森林(Random Forest)作为集成学习(Ensemble Learning) ...
2025-09-05Excel 区域名定义:从基础到进阶的高效应用指南 在 Excel 数据处理中,频繁引用单元格区域(如A2:A100、B3:D20)不仅容易出错, ...
2025-09-05CDA 数据分析师:以六大分析方法构建数据驱动业务的核心能力 在数据驱动决策成为企业共识的当下,CDA(Certified Data Analyst) ...
2025-09-05SQL 日期截取:从基础方法到业务实战的全维度解析 在数据处理与业务分析中,日期数据是连接 “业务行为” 与 “时间维度” 的核 ...
2025-09-04在卷积神经网络(CNN)的发展历程中,解决 “梯度消失”“特征复用不足”“模型参数冗余” 一直是核心命题。2017 年提出的密集连 ...
2025-09-04CDA 数据分析师:驾驭数据范式,释放数据价值 在数字化转型浪潮席卷全球的当下,数据已成为企业核心生产要素。而 CDA(Certified ...
2025-09-04K-Means 聚类:无监督学习中数据分群的核心算法 在数据分析领域,当我们面对海量无标签数据(如用户行为记录、商品属性数据、图 ...
2025-09-03特征值、特征向量与主成分:数据降维背后的线性代数逻辑 在机器学习、数据分析与信号处理领域,“降维” 是破解高维数据复杂性的 ...
2025-09-03CDA 数据分析师与数据分析:解锁数据价值的关键 在数字经济高速发展的今天,数据已成为企业核心资产与社会发展的重要驱动力。无 ...
2025-09-03解析 loss.backward ():深度学习中梯度汇总与同步的自动触发核心 在深度学习模型训练流程中,loss.backward()是连接 “前向计算 ...
2025-09-02要解答 “画 K-S 图时横轴是等距还是等频” 的问题,需先明确 K-S 图的核心用途(检验样本分布与理论分布的一致性),再结合横轴 ...
2025-09-02CDA 数据分析师:助力企业破解数据需求与数据分析需求难题 在数字化浪潮席卷全球的当下,数据已成为企业核心战略资产。无论是市 ...
2025-09-02Power BI 度量值实战:基于每月收入与税金占比计算累计税金分摊金额 在企业财务分析中,税金分摊是成本核算与利润统计的核心环节 ...
2025-09-01巧用 ALTER TABLE rent ADD INDEX:租房系统数据库性能优化实践 在租房管理系统中,rent表是核心业务表之一,通常存储租赁订单信 ...
2025-09-01