
CDA数据分析研究院出品,转载需授权
从广义上讲,人工智能涉及机器做一些只有人才能做到的事情。也就是说,计算机科学家不同意几年前的某些计算能力是否可以构成人工智能。如今,许多这些功能可能仅仅只被称为软件。
人工智能的现代复兴是由一种非常特殊的计算方式的进步推动的:也就是机器学习。我们经常在Emerj上交替使用人工智能和机器学习,但许多计算机科学家喜欢将两者分开。关于人工智能的究竟是由什么构成的,在该领域存在(并且可能永远存在)辩论。一些计算机科学家不考虑人工智能的计算能力,除非它们涉及机器学习。
这些科学家可能会继续改变他们的人工智能参数,直到实现人工一般智能(AGI)。AGI的发展(计算机执行人类所能执行的任何智力任务的能力)是许多计算机科学研究人员的目标,但实现它可能需要很多年,并且它值得在其他的时间用专门的一篇文章来形容。
研究人员似乎同意的一点是机器学习在某种程度上属于人工智能的范畴,而人工智能本身属于计算机科学学科。深度学习是后续文章的主题,并且深度学习是机器学习的一个子集。这一概念由NVIDIA提出,解释如下:
Yoshua Bengio,过去二十年来最杰出的深度学习研究者之一,为我们提供了他自己对机器学习的定义:
机器学习研究是人工智能研究的一部分,旨在通过数据,观察和与世界的互动为计算机提供知识。获得的知识允许计算机正确地推广到新设置。
尽管机器学习在今天的人工智能思想的主导地位,但人工智能曾经以一种截然不同的方式被研究。
专家系统和人工智能的早期方法
在21世纪末和2010年初的机器学习取得进步之前,人工智能的兴趣围绕着一个完全独立的计算能力。在60年代和70年代,专家系统主导了人工智能的开发。开发人员试图通过将其概念化为一系列if-then语句来模仿人类思想和决策。实质上,专家系统是一个由if-then场景构建的大型网络,通过该场景过滤查询以实现一些预编程的最终结果。专家系统背后的if-then语句被硬编码到软件中。因此,AI每次都会以相同的方式响应某些输入。
如果所得到的软件在工业中具有任何实际用途,那么这些if-then场景需要适当地通知领域专家。例如,为了建立一个专家系统来了解当出现某种传染病时应该做些什么,开发人员需要以某种方式将软件的if-then场景建立在传染病专家在传染病时可能做的事情的基础上 。
例如,开发人员可以采访40位不同的传染病医疗专家,并向他们询问有关症状和治疗的一系列问题,并将他们的反应硬编码到专家系统中。这需要软件开发人员进行大量的深谋远虑和规划。他们需要与领域专家合作,列出某人可能询问某个特定主题的所有可能问题,然后找出这些问题的所有可能的答案。如果他们没不能解释一个问题或答案,那么专家系统将无法提供用户问题的准确答案。
另一个例子可能涉及客户支持票。专家系统可以建立在以下if-then场景上:“如果电子邮件的正文中包含”退款“字样,则将票证路由到退款票据桶。”这当然看起来是一个合理的规则,它确实可能会将大部分退款票据路由到相应的桶中。该规则不考虑客户谈论与退款相关的概念或使用退款相关短语而不使用“退款”一词的支持票。
客户可能会说,“如果你不给我回电话,我就会打电话给我的银行。”一个有业务背景的人力支持代理可能知道这样的门票通常涉及到客户不知道他们账户的费用是他们注册的年度订阅服务。代理商可能也知道,在几乎所有情况下,客户都希望退还该费用。基于专家系统的软件永远无法将这些票据退还到退款桶中。
专家系统的局限性
从理论上讲,具有业务“客户支持票证背景”的人员可以在构建专家系统之前将有关此场景的信息传递给构建专家系统的开发人员。if-then规则可能类似于“如果电子邮件的正文包含'bank'一词,则将票证路由到退款票据桶。”
但是,如果该企业最近才开始销售其订购服务,那么其基于专家系统的客户支持软件将无法适应进入系统的各种票证,并对其订阅服务进行模糊引用,例如上面的示例。在业务联系开发人员以使用另一个if-then规则更新软件之前,这些票证不会被路由到退款桶中。
围绕这一限制进行工作明显是不切实际的,这也是专家系统(以及通常的人工智能)在一段被称为“人工智能寒冬”的时期内衰退的最大原因。
随着互联网的出现,从在线购物到保险理赔的大量数据都变得数字化。数据现在已成为常态,即使是最小的公司也将数据存储在数字格式中。
机器学习是一种让计算机以与专家系统完全不同的方式模仿人类思想和决策的方式。如果一个人有能力存储,访问和理解他们可以做出决策的大脑中的数十亿个数据点,他们可能会做出与我们现在做出决策的方式截然不同的决策; 在任何情况下,在绝大多数情况下,对更多信息和背景做出的决定优于在较少信息和较少背景下进行的决策。
简而言之,机器学习模型可以对数十亿个数据点做出决策。它们理解这些数据,并将其转化为可能性,为它们的产出提供动力。这与专家系统非常不同,专家系统每个if-then规则只有一个输出,每个“if”只有一个“then”。更重要的是,机器学习模型是为了适应新的意外的输入而构建的。专家系统不知道如何处理不属于退款票规则的退票,但随着时间的推移,机器学习模型可以开始将“我正在给我的银行打电话”路由到退款桶中,作为回应人的反馈。
机器学习的适应性
如果人员在其路由正确或不正确时向模型指示,那么它可以使用该反馈来通知其基于其票证路由的可能性。虽然我们建议不要将人工智能拟人化,但它本身会问自己“这张票应该被送到退款桶的可能性是多少?”每当提供支持票时。如果确定可能性很高,则票证将被路由到退款桶。如果确定可能性较低,则可以对模型进行编程以标记票据以供人工审查。
这种适应性是机器学习和专家系统之间的关键差异,这就是为什么一些计算机科学家不再考虑专家系统和人工智能的其他计算能力的原因。它也是斯坦福定义机器学习的基础:“让计算机在没有明确编程的情况下采取行动的科学。”
这种适应性的一个例子是Netflix的推荐引擎。当平台上的新用户第一次从俄克拉荷马州的某个位置登录时,推荐引擎除了用户的IP位置之外几乎没有任何关于该用户的数据。但是,Netflix确实有几百万个数据点来自于俄克拉荷马州的其他用户。推荐引擎可以使用该数据来基于过去与类似用户的交互来做出关于该新用户可能想要看到什么内容的一般假设。
当用户继续与Netflix交互时,他们选择观看的数据,当他们暂停这些节目或完全停止观看时,以及显示他们连续观看的数据通知机器学习模型推荐给用户可能喜欢的节目。该模型响应用户的交互并适应他们的偏好。用户的数据还为其他用户提供了推荐,这些用户具有第一个用户相似的偏好和相似的人口统计学特征。
机器学习的核心是在大量数据上进行训练机器,使机器能够识别数据中的模式,从而确定使用特定输出而获得成功的可能性。
机器学习的局限性
机器学习有其局限性,事实上,当涉及到一个核心概念时,它比专家系统更糟糕:那就是可解释性。
我们可以遵循一系列if-then规则来弄清楚专家系统是如何产生特定输出的。如果结果证明他们的答案”then“是不正确的,那么就允许开发人员修复这些规则。专家系统是高度透明的,这在某些领域甚至是必要的,这是有帮助的。
如果患者询问他们的医生为什么他们诊断患有疾病,医生如果根据专家系统的输出做出诊断,那么医生可以回答这个问题。从理论上讲,他们可以通过专家系统的if-then规则读取导致其输出的信息,以及患者的诊断结果。
机器学习模型不是这种情况,它比if-then树复杂得多。机器学习模型背后的神经网络可能如下所示:
这是华威大学的典型的drop-net神经网络
如果医生根据机器学习模型的输出进行诊断,他们将无法向患者解释清楚。机器学习模型基于在数据集中自行构建的模式进行输出。人类在没有任何上下文的情况下为机器学习算法提供数据,并且该算法提供了一些基于人类目前无法识别的模式来确定结果。
机器学习模型可以基于任意数量的数据点为患者进行诊断。这可能是因为患者的CT扫描异常。也可能是因为他们的人口统计学特征,他们的名字,以及他们的保险索赔历史,比其他人更容易被诊断出患有特定疾病。医生既无法确认也无法否认。
这个问题也就是所谓的人工智能的“黑匣子”。机器学习模型可以通过以人类无法达到的规模查找数据模式来进行预测和推荐,但没有人能够解释模型如何或为何做出这些预测和建议。没有透明度,这是某些行业的一个主要问题,正如我们在报告中讨论的那样,在B2B和B2C中应用人工智能 - 有什么区别?对于计算机科学研究人员而言,黑匣子是一个令人担忧的问题,被称为“人工智能教父”的杰弗里·辛顿甚至建议“把它扔掉,然后再重新开始”。
商业领袖的经验
绝大多数商业领袖可能会考虑的人工智能解决方案,我们在Emerj所涵盖的确实是机器学习解决方案。商业领袖可以在谈话中使用人工智能,并希望他们的数据科学家能够理解他们所指的是机器学习。从历史的角度来看,专家系统通常被认为是人工智能,但是在80年代末期之前开发的计算能力通常不是人们在谈论人工智能时所指的。
有可能在未来十年或二十年内,机器学习本身将面临类似的命运,被归纳为计算机科学史的范畴,作为一种计算能力,它在当时发挥了应有的作用,但最终让位于某种更复杂,或许更具解释性的东西。再或者,机器学习可能不会被抛弃,而是变得无处不在,以至于它不再被称为人工智能。
商业领袖可以将专家系统和机器学习视为人工智能频谱的两端。现在,开发人员在开始构建人工智能解决方案时,通常不会构建专家系统; 他们建立机器学习模型。是实现人工智能相同目标的两种截然不同的方法:让计算机完成传统上为人类保留的智力任务。机器学习和专家系统是人工智能的子集,它是整个计算机科学的一个子集。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
2025 年,数据如同数字时代的 DNA,编码着人类社会的未来图景,驱动着商业时代的运转。从全球互联网用户每天产生的2.5亿TB数据, ...
2025-06-052025 年,数据如同数字时代的 DNA,编码着人类社会的未来图景,驱动着商业时代的运转。从全球互联网用户每天产生的2.5亿TB数据, ...
2025-05-27CDA数据分析师证书考试体系(更新于2025年05月22日)
2025-05-26解码数据基因:从数字敏感度到逻辑思维 每当看到超市货架上商品的排列变化,你是否会联想到背后的销售数据波动?三年前在零售行 ...
2025-05-23在本文中,我们将探讨 AI 为何能够加速数据分析、如何在每个步骤中实现数据分析自动化以及使用哪些工具。 数据分析中的AI是什么 ...
2025-05-20当数据遇见人生:我的第一个分析项目 记得三年前接手第一个数据分析项目时,我面对Excel里密密麻麻的销售数据手足无措。那些跳动 ...
2025-05-20在数字化运营的时代,企业每天都在产生海量数据:用户点击行为、商品销售记录、广告投放反馈…… 这些数据就像散落的拼图,而相 ...
2025-05-19在当今数字化营销时代,小红书作为国内领先的社交电商平台,其销售数据蕴含着巨大的商业价值。通过对小红书销售数据的深入分析, ...
2025-05-16Excel作为最常用的数据分析工具,有没有什么工具可以帮助我们快速地使用excel表格,只要轻松几步甚至输入几项指令就能搞定呢? ...
2025-05-15数据,如同无形的燃料,驱动着现代社会的运转。从全球互联网用户每天产生的2.5亿TB数据,到制造业的传感器、金融交易 ...
2025-05-15大数据是什么_数据分析师培训 其实,现在的大数据指的并不仅仅是海量数据,更准确而言是对大数据分析的方法。传统的数 ...
2025-05-14CDA持证人简介: 万木,CDA L1持证人,某电商中厂BI工程师 ,5年数据经验1年BI内训师,高级数据分析师,拥有丰富的行业经验。 ...
2025-05-13CDA持证人简介: 王明月 ,CDA 数据分析师二级持证人,2年数据产品工作经验,管理学博士在读。 学习入口:https://edu.cda.cn/g ...
2025-05-12CDA持证人简介: 杨贞玺 ,CDA一级持证人,郑州大学情报学硕士研究生,某上市公司数据分析师。 学习入口:https://edu.cda.cn/g ...
2025-05-09CDA持证人简介 程靖 CDA会员大咖,畅销书《小白学产品》作者,13年顶级互联网公司产品经理相关经验,曾在百度、美团、阿里等 ...
2025-05-07相信很多做数据分析的小伙伴,都接到过一些高阶的数据分析需求,实现的过程需要用到一些数据获取,数据清洗转换,建模方法等,这 ...
2025-05-06以下的文章内容来源于刘静老师的专栏,如果您想阅读专栏《10大业务分析模型突破业务瓶颈》,点击下方链接 https://edu.cda.cn/g ...
2025-04-30CDA持证人简介: 邱立峰 CDA 数据分析师二级持证人,数字化转型专家,数据治理专家,高级数据分析师,拥有丰富的行业经验。 ...
2025-04-29CDA持证人简介: 程靖 CDA会员大咖,畅销书《小白学产品》作者,13年顶级互联网公司产品经理相关经验,曾在百度,美团,阿里等 ...
2025-04-28CDA持证人简介: 居瑜 ,CDA一级持证人国企财务经理,13年财务管理运营经验,在数据分析就业和实践经验方面有着丰富的积累和经 ...
2025-04-27