京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据与情感分析:言多必得与言多必失
SmogFarm从事的是基于大数据的情绪分析,衡量、跟踪、聚合数百万人的情绪,然后做出全球第一份衡量群众心理的定量指标—地球脉搏。为什么要这么做?因为数据就是未来,情感是笔大买卖,选举、调查结果、流行新闻故事乃至于股市都会受到 “群众” 情绪的影响。
言多必得
相比之下,KredStreet则找到了另一个似乎更容易变现的垂直商业模式并已开始进行不公开测试:社会化股票交易员排名(The Social Stock Trader Rankings)。The Social Stock Trader Rankings 对 StockTwits 的数据进行情绪分析,对 Twitter 数据流进行采样,以便确定交易员总体看涨还是看跌。它还会将当前的股市表现与交易员过去的涨跌判断进行比对,进而依据交易员的准确率对其进行评分和排名。
这个排名系统的创意的确好。因为这里一切都是靠实力和结果说话,无名之辈只要预测准确率高也能把夸夸其谈的知名人士压倒。实际上,这一思路完全可以推广到许多领域,比方说倡导声音有力则不需名气的舆论网络初创企业 State的做法。说实话,这套东西有时候的确比文凭和砖家管用。
当然 SmogFarm/KredStreet 之流所从事的情绪分析,以及Summly从事的自然语言处理,还有Palantir从事的数据挖掘等尚处在早期阶段,还很不成熟。但请你设想一下 5年 之后。如果他们的大数据、高能量探照灯打在Facebook timeline这样的东西上,会有多少东西被他们洞悉?
几年前,EFF(电子前沿基金会)发现,哪怕是像浏览器设置这么简单的东西都会让你的匿名性下降到无法想象的地步。上一周,一项新研究又发现人的移动轨迹具有高度的独特性,按照这份研究的说法,从各人匿名提供的手机方位数据中只需抽取四个时空点就能识别出该用户,识别率高达 95%。好的软件能够从这些看似稀疏、空白的数据中挖掘出甚多宝物。
言多必失
随着语言和图像处理软件的不断进化,一旦被运用到 Facebook timeline 这样的东西上,就有可能产生出你意想不到的效果。你所说的话、发出去的图、玩过的游戏等,都会逐渐勾勒出你本人的一幅准确得令人恐怖的肖像,那些东西可能是你从来都不曾想公开的隐私。
更糟的是这件事有可能容易得出奇。老板可能根本就不需要通读你的 Facebook timeline,只需将档案分析软件往你的头像一点,半分钟之后,你的工作习惯、神经衰弱、人生受挫、情绪不稳、对老板的态度等悉数就被推断出来—你的照片、评论、喜欢、顶等,这些信息从个体上看虽然毫无意义,但是拼凑起来就能形成你的拼图。
这是一笔大买卖。前不久,IBM 开发的新型安全工具就能够运用大数据来识别安全威胁和不满员工。Facebook 之流显然也指望此类大数据应用为其定向广告挖掘出大金矿。
但是这会受到用户的反制。我们可以设想,一旦这样的工具成熟起来,大家在网上的表现一定不会再像以前那样直率,会变得更加小心翼翼。或者甚至只看不说。这样的网络到头来也许只有两种结果:死气沉沉、人人自危,或者只谈风月、口是心非。
扎克伯格定律认为互联网用户共享的信息每年都会翻番。但是一旦大家都意识到言多必失时这条规律还能不能延续?
工具无所谓好坏,言多必得还是言多必失,要看用者做不做恶,对于用户和商家来说结果只有两个:双赢或双输,善用则情感成为好买卖,滥用则数据没有未来。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在日常办公中,数据透视表是Excel、WPS等表格工具中最常用的数据分析利器——它能快速汇总繁杂数据、挖掘数据关联、生成直观报表 ...
2026-02-28有限元法(Finite Element Method, FEM)作为工程数值模拟的核心工具,已广泛应用于机械制造、航空航天、土木工程、生物医学等多 ...
2026-02-28在数字化时代,“以用户为中心”已成为企业运营的核心逻辑,而用户画像则是企业读懂用户、精准服务用户的关键载体。CDA(Certifi ...
2026-02-28在Python面向对象编程(OOP)中,类方法是构建模块化、可复用代码的核心载体,也是实现封装、继承、多态特性的关键工具。无论是 ...
2026-02-27在MySQL数据库优化中,索引是提升查询效率的核心手段—— 面对千万级、亿级数据量,合理创建索引能将查询时间从秒级压缩到毫秒级 ...
2026-02-27在数字化时代,企业积累的海量数据如同散落的珍珠,若缺乏有效的梳理与分类,终将难以发挥实际价值。CDA(Certified Data Analys ...
2026-02-27在问卷调研中,我们常遇到这样的场景:针对同一批调查对象,在不同时间点(如干预前、干预后、随访期)发放相同或相似的问卷,收 ...
2026-02-26在销售管理的实操场景中,“销售机会”是核心抓手—— 从潜在客户接触到最终成交,每一个环节都藏着业绩增长的关键,也暗藏着客 ...
2026-02-26在CDA数据分析师的日常工作中,数据提取、整理、加工是所有分析工作的起点,而“创建表”与“创建视图”,则是数据库操作中最基 ...
2026-02-26在机器学习分析、数据决策的全流程中,“数据质量决定分析价值”早已成为行业共识—— 正如我们此前在运用机器学习进行分析时强 ...
2026-02-25在数字化时代,数据已成为企业决策、行业升级的核心资产,但海量杂乱的原始数据本身不具备价值—— 只有通过科学的分析方法,挖 ...
2026-02-25在数字化时代,数据已成为企业核心资产,而“数据存储有序化、数据分析专业化、数据价值可落地”,则是企业实现数据驱动的三大核 ...
2026-02-25在数据分析、机器学习的实操场景中,聚类分析与主成分分析(PCA)是两种高频使用的统计与数据处理方法。二者常被用于数据预处理 ...
2026-02-24在聚类分析的实操场景中,K-Means算法因其简单高效、易落地的特点,成为处理无监督分类问题的首选工具——无论是用户画像分层、 ...
2026-02-24数字化浪潮下,数据已成为企业核心竞争力,“用数据说话、用数据决策”成为企业发展的核心逻辑。CDA(Certified Data Analyst) ...
2026-02-24CDA一级知识点汇总手册 第五章 业务数据的特征、处理与透视分析考点52:业务数据分析基础考点53:输入和资源需求考点54:业务数 ...
2026-02-23CDA一级知识点汇总手册 第四章 战略与业务数据分析考点43:战略数据分析基础考点44:表格结构数据的使用考点45:输入数据和资源 ...
2026-02-22CDA一级知识点汇总手册 第三章 商业数据分析框架考点27:商业数据分析体系的核心逻辑——BSC五视角框架考点28:战略视角考点29: ...
2026-02-20CDA一级知识点汇总手册 第二章 数据分析方法考点7:基础范式的核心逻辑(本体论与流程化)考点8:分类分析(本体论核心应用)考 ...
2026-02-18第一章:数据分析思维考点1:UVCA时代的特点考点2:数据分析背后的逻辑思维方法论考点3:流程化企业的数据分析需求考点4:企业数 ...
2026-02-16