京公网安备 11010802034615号
经营许可证编号:京B2-20210330
作者 | CDA数据分析师
情感分析是文本的语义挖掘,可识别和提取原始文本材料中的主观信息,并帮助企业在监控在线对话的同时了解其品牌,产品或服务的社会情绪。但是,对社交媒体流的分析通常仅限于基本的情绪分析和基于计数的指标。这就好比仅仅是在表面划过,而错过了那些等待被发现的高价值见解。那么,一个品牌应该怎么做才能抓住那些容易获得的,同时价值比较高的见解呢?
随着深度学习的发展,算法分析文本的能力已经有了很大的提高。创造性地运用先进的人工智能技术是进行深入研究的有效工具。我们相信,根据以下内容对客户关于品牌的讨论进行分类非常重要:
这些基本概念在结合使用时,就成为一个非常重要的工具,可以准确地分析数百万次品牌讨论信息。在帖子中,我们以Uber为例,演示其工作原理。请继续阅读!
情绪分析
情绪分析是最常见的文本分类工具,它可以分析传入的消息并判断潜在的情绪是正面的,还是负面的,还是中立的。您可以在此处输入一个您选择的句子,并通过演示来判断潜在的情绪。
意图分析
意图分析通过分析消息背后的用户意图,并确定其是否涉及意见,新闻,营销,投诉,建议,欣赏或查询,从而来提升客户服务的质量。
上下文语义搜索(CSS)
现在事情变得很有趣了。想要获得可行的结论见解,了解用户在讨论品牌的哪个方面是很重要的。例如:亚马逊希望隔离与以下内容相关的消息:延迟交货,账单问题,促销相关的查询,产品评论等。另一方面,星巴克希望基于信息是否与员工行为,新咖啡口味,卫生反馈,在线订单,商店名称和位置相关等进行分类。但是,如何做到这一点呢?
我们介绍了一种智能搜索算法,称为 上下文语义搜索(CSS)。CSS的工作方式是将数千条消息和一个概念(例如 Price)作为输入,并过滤与给定概念紧密匹配的所有消息。下面所示的图形展示了CSS如何对业界所使用的现有方法的改进。
过滤所有与Price相关的消息的常规方法是对Price和其他紧密相关的单词(例如:price,change,$,paid)进行关键字搜索 。但是,这种方法不是很有效,因为几乎不可能想到所有相关的关键字,以及表示特定概念的变体。另一方面,CSS只是将概念名称(Price)作为输入,即使未提及概念关键字的明显变体,也可以过滤所有上下文相似的内容。
对于好奇的读者,我们想看看这是如何工作的。AI技术用于将每个单词转换为超空间中的特定点,这些点之间的距离用于识别上下文与我们正在探索的概念相似的信息。下面的图片展示了它的可视化效果:
下面来看一下CSS的实际应用,以及它是如何在以下示例中处理与Uber相关的评论的:
同样的,请看下面这条博文:
Flat rate was the best thing that happened this year. @uberbring it back!!!! #MakeUberGreatAgain
— A Boogie (@Finessenomics) March 3, 2017
在以上两种情况下, 即使这些消息中未提及Price一词 ,该算法也将这些消息分类为与Price相关的上下文。
优步是全球市值最高的初创企业,一直是共享经济的先驱。Uber在全球500多个城市开展业务,并为庞大的用户群提供服务,因此得到了用户的大量反馈,建议和投诉。通常,社交媒体是记录此类问题的首选。大量的输入数据使分析,分类和产生结论性见解成为一项具有挑战性的任务。
我们分析了数字媒体上有关几个产品主题的在线评论: 取消,付款,价格,安全和服务。
为了广泛覆盖数据源,我们从Uber官方Facebook页面上的最新评论中收集了数据,这些推文中提到了Uber和有关Uber的最新新闻。以下是所有渠道上的数据点分布:
分析用户评论的情绪可以使您对整体品牌的认知有一个了解。但是,要进行更深入的研究,借助上下文语义搜索对数据进行进一步分类是很重要的。
我们在同一个数据集上运行了上下文语义搜索算法,并考虑了上述的类别(取消,付款,价格,安全性和服务)。
情绪分析
值得注意的是,只有Price相关的正面评论数量超过负面评论 ,与其他所有类别相关的评论主要是负面情绪。为了深入研究,我们分析了这些评论的意图。Facebook是一个社交平台,评论充斥着随机内容,新闻分享,营销和促销内容以及垃圾邮件/无关内容。我们来看一下Facebook评论上的意图分析:
因此,我们删除了所有这些不相关的意图类别,并重新生成了结果:
每个类别的情感都有明显的变化。特别是在Price相关评论中,正面评论的数量从46%下降到了29%。
这使我们了解了CSS如何从数字媒体中产生深入的见解。因此,一个品牌可以分析这样的推文并从它们的积极点上或者从消极方面获得产品或业务的反馈。
情绪分析
对获得的推文也进行了类似的分析。 在最初的分析中, 与Payment和 Safety相关的推文情绪比较复杂。
要了解真实的用户意见,投诉和建议,我们必须再次过滤不相关的Tweets(垃圾邮件,垃圾邮件,市场营销,新闻和随机信息):
与 Payment 相关的正面推文数量显着减少 。此外, Safety 类别(以及相关关键字)的正面推文数量也大幅下降 。
此外,Cancel,Payment和Service(以及相关词)是Twitter评论中谈论最多的话题。似乎人们谈论最多的是司机取消乘车以及向他们收取的取消费。看看这个推文:
I still haven’t heard from you about you charging me a cancellation fee for the driver cancelling my ride!
— Anagh Padmanabhan (@anagh) March 2, 2017
像Uber这样的品牌可以依靠这种分析方法,并根据最关键的话题采取行动。例如, 与 Service 相关的推文所载的正向推文所占的百分比最低,而负向的推文所占的百分比最高。因此,Uber可以分析此类推文并对其采取行动以提高服务质量。

可以理解,安全一直是新闻中谈论最多的话题。有趣的是,在每个类别中,新闻情绪总体上都是正面的,个体上都是积极的。
我们也根据新闻的受欢迎程度对新闻进行分类。受欢迎程度的得分归因于该文章在不同社交媒体渠道上的占有率。以下是最热门的新闻列表:
随着技术的进步,从社交媒体数据中获取有意义的反馈的时代已经到来。Uber案例研究让我们了解了上下文语义搜索算法的功能。现在该是您的组织超越总体情绪和基于计数的指标的时候了。许多公司一直在利用数据去获取一些业务信息,但是想要获得最深入的信息,您必须利用AI,深度学习和智能分类器(如上下文语义搜索和情感分析)的力量。
CDA学员免费下载查看报告全文:2026全球数智化人才指数报告【CDA数据科学研究院】.pdf
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数字化时代,商业竞争的核心已从“经验驱动”转向“数据驱动”,越来越多的企业意识到,商业分析不是简单的数据统计与报表呈现 ...
2026-05-06在Excel数据透视表的实操中,“引用”是连接透视表与公式、辅助数据的核心操作,而相对引用作为最基础、最常用的引用方式,其设 ...
2026-05-06 很多数据分析师做过按月份的销售额趋势图,画过按天的流量折线图,但当被问到“时间序列和普通数据有什么本质区别”“季节性 ...
2026-05-06在Excel数据分析中,数据透视表是汇总、整理海量数据的高效工具,而公式则是实现数据二次计算、逻辑判断的核心功能。实际操作中 ...
2026-04-30Excel透视图是数据分析中不可或缺的工具,它能将透视表中的数据快速可视化,帮助我们直观捕捉数据规律、呈现分析结果。但在实际 ...
2026-04-30 很多数据分析师能熟练地计算指标、搭建标签体系,但当被问到“画像到底在解决什么问题”“画像和标签是什么关系”“画像如何 ...
2026-04-30在中介效应分析中,人口统计学变量(如年龄、性别、学历、收入、职业等)是常见的控制变量或调节变量,其处理方式直接影响分析结 ...
2026-04-29在SQL数据库实操中,日期数据的存储与显示是高频需求,而“数字日期”(如20240520、20241231、45321)是很多开发者、数据分析师 ...
2026-04-29 很多分析师在设计标签时思路清晰,但真到落地环节却面临“数据在手,不知如何转化为可用标签”的困境:或因加工方式选择不当 ...
2026-04-29在手游行业竞争日趋白热化的当下,“流量为王”早已升级为“留存为王”,而付费用户留存率更是衡量一款手游盈利能力、运营质量的 ...
2026-04-28在日常MySQL数据库运维与开发中,经常会遇到“同一台服务器上,两个不同数据库(以下简称“源库”“目标库”)的表数据需要保持 ...
2026-04-28 很多分析师每天和数据打交道,但当被问到“标签是什么”“标签和指标有什么区别”“标签体系如何设计”时,却常常答不上来。 ...
2026-04-28箱线图(Box Plot)作为一种经典的数据可视化工具,广泛应用于统计学、数据分析、科研实证等领域,核心价值在于直观呈现数据的集 ...
2026-04-27实证分析是社会科学、自然科学、经济管理等领域开展研究的核心范式,其核心逻辑是通过对多维度数据的收集、分析与解读,揭示变量 ...
2026-04-27 很多数据分析师精通Excel函数和数据透视表,但当被问到“数据从哪里来”“表和视图有什么区别”“数据库管理系统和SQL是什么 ...
2026-04-27在大数据技术飞速迭代、数字营销竞争日趋激烈的今天,“精准触达、高效转化、成本可控”已成为企业营销的核心诉求。传统广告投放 ...
2026-04-24在游戏行业竞争白热化的当下,用户流失已成为制约游戏生命周期、影响营收增长的核心痛点。据行业报告显示,2024年移动游戏平均次 ...
2026-04-24 很多业务负责人开会常说“我们要数据驱动”,最后却变成“看哪张报表数据多就用哪个”,往往因为缺乏一套结构性的方法去搭建 ...
2026-04-24在Power BI数据可视化分析中,切片器是连接用户与数据的核心交互工具,其核心价值在于帮助使用者快速筛选目标数据、聚焦分析重点 ...
2026-04-23以数为据,以析促优——数据分析结果指导临床技术改进的实践路径 临床技术是医疗服务的核心载体,其水平直接决定患者诊疗效果、 ...
2026-04-23