
关于情感分析,你不得不知道的11件事
近来,关于情感分析的研究一直被大家所津津乐道,然而关于这项分析方法究竟有多大的实用性,则是众说纷纭。有人认为情感分析堪比打开人类市场研究新世界大门的钥匙,而另一些人则认为,这项技术只是骗人的万灵油,甚至与占卜无异。那么,究竟谁是对的呢?
相较而言,我(笔者)更倾向于站在前者的阵营中。基于文本分析,自动情感分析技术为基于李克特量表的传统分析方法(Likert-reliant methodologies)注入了新的动力,使得研究人员能通过社群倾听技术实时掌控客户反馈的倾向变化,并由此实现了对客户心声的深入挖掘。
对于后者的阵营,我认为他们对情感分析产生质疑的原因可能来自于对这种分析方法实现能力与局限性的认识扭曲。这样的认识扭曲也许是由于某些能力不足的解决方案供应商造成的,不过不管它们究竟来自何方,我都会倾力而为去揭穿它们,还原一个有真正实际意义的情感分析技术。
我们目标是鼓励适当的使用情感分析技术并防止滥用。为了做到这点,对市场教育的呼唤十分重要,我通过会议的形式做了很多这样的事,在今年7月15号到16号的纽约情感分析研讨会上,我特地点明了这样十一件情感分析研究者必须知道的事:
1)在情感分析中,通过直接匹配词典来查找词汇是一种简单明了的方法,也但略显粗俗。词的意思往往会根据句式、语境以及上下文之间的关联而发生变化,进行情感分析时我们需要将语言学与统计学的方法都应用到其中。
2)文档层面的情感分析或许正在面临过时。我们情感分析的目标应该关注于实体(entity)、概念(concept)以及主题(topic)的层面。(例如,一部iPhone6是一个实体,iPhone是一个概念范畴,而智能手机则是它所属的主题)
3)“情感”的一般语言定义包括态度(attitude)、意见(opinion)、感觉(feelings)和情绪(emotion)。最先进的情感分析技术可以让你超越正负面倾向得分的局限,根据情绪——如快乐、惊讶、恐惧、厌恶、愤怒、悲伤等对文本情感进行评价,而不是仅仅是一个表达程度的分数。
4)请将眼界放宽:情感分析是情感计算(Affective computing)大家族的一份子,这个家族涉及到了所有与人类情感相关、来自人类情感或是对人类情感产生影响的现象计算研究。情感分析与家族中的其他伙伴皆有所联系,但在技术和方法上有着较为明显的区别。
5)并非所有的情感都是平等的。不论是情感的倾向还是强度,我们都需要努力去理解。同时,研究情感如何转化为行动也具有同样重要的意义。
6)不论你是否在项目中使用了语言工程、统计模型与机器学习方法,在很多情况下,也许针对特定领域训练合适的模型,才是模型优化的关键。
7)必须注意那些有关于准确率的说法。对于模型的准确性,这世界上不存在绝对的衡量标准,因此在度量模型的准确性时,我们总会遇到各种各样的麻烦。正因如此,有的解决方案供应商们甚至可能在提出分析模型之后对模型准确性的测量过程避而不谈。一种公认可行的准确度测量方法是将模型结果与一份经过完全精准的人工注释/分类的语料进行对比,这也意味着我们需要让人工和机器同时去进行一项庞大的语料分析工作,再进行二者匹配程度的计算。但是当你真的去尝试这样的做法时,所谓人工一方作出的判断究竟是对是错,同样也很难说明清楚。与此同时,面向不同层面的文本分析软件之间也很难进行准确度的对比,例如有些软件只做了文档层面的分析,而另一些则能够对实体和概念进行了解析,我们能说在实体层面具有70%准确率的软件就优于在文档层面具有97%准确率的软件吗?
8)文本是最常见的情感数据来源,但它并不是唯一的一个。针对视频的面部编码技术,针对音频流的语音分析,都可以用于检测人类的情绪反应,而这些也都是更先进的情感状态评估方法。而有关人类情感分析下一个前沿领域也有可能是:神经科学、可穿戴仪器开发和生理学的其他研究手段。
9)语言是人类使用的最有活力和发展最快速的工具之一。计算机技术在社会中普及给了我们前所未有的语言表现能力,众所周知的表情符号(emoji)就是这一进程中的典型例子。表情符号不仅仅是人类语言的扩音器,它在发展过程中逐渐获得了自己的语法和特殊语义,从而自然而然地如潮水般涌入广大的网络社交媒体中。对于情感分析研究者来说,我们也应该紧跟时代发展的脚步,去针对各种新诞生的语言表达形式进行相关的挖掘与研究。
10)通过将行为表现与情感分析模型进行联系,或是根据人口与文化范畴对语料进行分类,能够帮助你提升分析与预测的能力。当你面对庞杂的大规模数据时,请毫不犹豫地运用这个方法。
11)一些先进的概念,如动机、影响、维护和催化,都是建立在对人类情感和行为进行建模以及社群网络分析的基础上的。在数据咨询行业,研究的最主要目标是对市场以及消费者进行解析,而这种解析的最终目标则是创造使消费者“行动起来”的条件。作为情感分析研究者,你需要面向上述概念开展你的工作。
好了,上面便是我个人(笔者)对情感分析这些事的理解,当你在开始设计下一项有关的调查研究时,或是当你不知道如何将社交媒体挖掘应用到你的研究中时,不妨考虑一下使用情感分析。多思考一些实际可行的情感算法也许会对你有所帮助,将它结合于行为分析或是其他先进的市场细分技术,可能会使你找到洞悉潜在客户行为的方法。总而言之,情感分析值得重视,它是绝对能够为你的市场研究带来一些令人眼前一亮的新东西的。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
2025 年,数据如同数字时代的 DNA,编码着人类社会的未来图景,驱动着商业时代的运转。从全球互联网用户每天产生的2.5亿TB数据, ...
2025-06-052025 年,数据如同数字时代的 DNA,编码着人类社会的未来图景,驱动着商业时代的运转。从全球互联网用户每天产生的2.5亿TB数据, ...
2025-05-27CDA数据分析师证书考试体系(更新于2025年05月22日)
2025-05-26解码数据基因:从数字敏感度到逻辑思维 每当看到超市货架上商品的排列变化,你是否会联想到背后的销售数据波动?三年前在零售行 ...
2025-05-23在本文中,我们将探讨 AI 为何能够加速数据分析、如何在每个步骤中实现数据分析自动化以及使用哪些工具。 数据分析中的AI是什么 ...
2025-05-20当数据遇见人生:我的第一个分析项目 记得三年前接手第一个数据分析项目时,我面对Excel里密密麻麻的销售数据手足无措。那些跳动 ...
2025-05-20在数字化运营的时代,企业每天都在产生海量数据:用户点击行为、商品销售记录、广告投放反馈…… 这些数据就像散落的拼图,而相 ...
2025-05-19在当今数字化营销时代,小红书作为国内领先的社交电商平台,其销售数据蕴含着巨大的商业价值。通过对小红书销售数据的深入分析, ...
2025-05-16Excel作为最常用的数据分析工具,有没有什么工具可以帮助我们快速地使用excel表格,只要轻松几步甚至输入几项指令就能搞定呢? ...
2025-05-15数据,如同无形的燃料,驱动着现代社会的运转。从全球互联网用户每天产生的2.5亿TB数据,到制造业的传感器、金融交易 ...
2025-05-15大数据是什么_数据分析师培训 其实,现在的大数据指的并不仅仅是海量数据,更准确而言是对大数据分析的方法。传统的数 ...
2025-05-14CDA持证人简介: 万木,CDA L1持证人,某电商中厂BI工程师 ,5年数据经验1年BI内训师,高级数据分析师,拥有丰富的行业经验。 ...
2025-05-13CDA持证人简介: 王明月 ,CDA 数据分析师二级持证人,2年数据产品工作经验,管理学博士在读。 学习入口:https://edu.cda.cn/g ...
2025-05-12CDA持证人简介: 杨贞玺 ,CDA一级持证人,郑州大学情报学硕士研究生,某上市公司数据分析师。 学习入口:https://edu.cda.cn/g ...
2025-05-09CDA持证人简介 程靖 CDA会员大咖,畅销书《小白学产品》作者,13年顶级互联网公司产品经理相关经验,曾在百度、美团、阿里等 ...
2025-05-07相信很多做数据分析的小伙伴,都接到过一些高阶的数据分析需求,实现的过程需要用到一些数据获取,数据清洗转换,建模方法等,这 ...
2025-05-06以下的文章内容来源于刘静老师的专栏,如果您想阅读专栏《10大业务分析模型突破业务瓶颈》,点击下方链接 https://edu.cda.cn/g ...
2025-04-30CDA持证人简介: 邱立峰 CDA 数据分析师二级持证人,数字化转型专家,数据治理专家,高级数据分析师,拥有丰富的行业经验。 ...
2025-04-29CDA持证人简介: 程靖 CDA会员大咖,畅销书《小白学产品》作者,13年顶级互联网公司产品经理相关经验,曾在百度,美团,阿里等 ...
2025-04-28CDA持证人简介: 居瑜 ,CDA一级持证人国企财务经理,13年财务管理运营经验,在数据分析就业和实践经验方面有着丰富的积累和经 ...
2025-04-27