京公网安备 11010802034615号
经营许可证编号:京B2-20210330
谁在读你的微博 大数据分析将给出答案
现在,你的推文(Tweets)正在被哪些人阅读?他们往往是你所购产品的制造商。最近一项融合了许多学科知识的有趣实验正在用于分析淹没在推特(Twitter)宇宙大数据中的各种观点。Esri、IBM等致力于大数据研究的各个厂家目前都在挖掘Twitter内容,并且运用自己开发的方法对其进行分析。近年来,这种合作开启了一个研究的新时代,Esri公司的地理信息系统(GIS)技术联合IBM的语言与心理分析,可以共同解码互联网上那些浩如烟海的信息。
社交媒体地图
众所周知,我们处在信息爆炸的时代,大多数IT大佬都承认,如果不能尽快地控制数据的泛滥成灾,将会对人类进步形成巨大的威胁。驯服大数据需要发明新的技术,通过分析和可视化来更好地了解这个庞然大物。
多年来,社交媒体为Esri地图提供了丰富的数据源。2011年,Esri推出了日本地震图,这是一份概念验证(proof-of-concept)地图,来自日本数百万Tweets信息为地图的绘制提供了数据源,9.0级的本州地震后来自Tweets的数据帮助揭示了在危机中的那些急需物资救援的地点。从此,用社交媒体的内容充实各种地图就成了司空见惯的做法。2013年,Esri正式进入大数据领域,将大数据工作流程整合进该公司的ArcGIS产品中,并推出包括GIS Tools for Hadoop在内的数个GitHub开源项目,这些项目使大数据获得了地理空间能力。
品牌监测
社交媒体的高容量、多样化、高速度及真实性满足大数据的4大典型特征。每天都有超过5亿的Tweets信息发布以及超过35亿类似的自媒体信息发布,社交媒体是一个具有超大信息量并且充满噪声的数据源范例。在这些喋喋不休中,Twitter用户可分享其酸甜苦辣的各种经历和各种观点。但是过滤掉噪声,依然可以从那些充满观点的Tweets中窥见买家的心态和想法。
通过与IBM阿尔马登研究中心的加速发现实验室合作,Esri创建了一种称为舆情监控的交互式概念验证(proof-of-concept)地图,使用Tweets和地理空间技术来了解客户情感并聚焦于品牌管理。IBM阿尔马登研究中心的加速发现实验室是进行跨行业大数据分析的最先进的实验室。
Esri总裁Jack Dangermond说,“和GIS的出现一样,大数据分析的出现也是因为需要对出现的问题提供正确的答案。通过分析,我们提取了某些的答案并帮助各机构能更好地了解其客户。Esri/IBM联合舆情监控示范则结合了GIS系统和舆情监控领域的最新研究成果。”
Esri Tapestry数据为品牌管理提供有用的客户生活方式信息
解码Decahose
Tweets内容包含了大量的客户观点信息,因此早在2010年,Twitter就将其每日的用户输出内容进行商品化。Twitter建立了Tweets流许可制,各个企业以及咨询公司都可从这些数据中淘金。为了着手进行社交媒体分析,IBM从第三方经销商手中获得了Twitter DecaHose授权(特定时间段内随机抽取特定范围内百分之十的Tweets信息)。
针对这些信息,服装零售商所关心的是品牌管理工具是否可以监控Tweets中所有的客户观点。IBM加速发现实验室的研究员们准备利用品牌管理工具,从多个角度来回答这个有趣的问题。2013年3月,8家全国性服装品牌被选作样本,IBM与Esri合作进行联合舆情监控示范项目。
为了设计舆情监控示范系统,Esri的开发人员花了一天的时间与IBM的研究员们进行讨论,实验室中所有的软件、数据和专利技术都对其开放。最后,利用Portal for ArcGIS和ArcGIS for Server,Esri开发了一套交互式地图应用,通过位置和时间可视化Twitter用户数据。这有助于实验室定义Tweets内容模式,对人口统计资料和客户类型进行更直观的认识。IBM的社交媒体分析方法可以解码客户观点、位置及心理语言等各种属性,可以按地区对服装品牌形象进行评价。通过IBM加速发现实验室的算法,可推测出未包括在Tweets中的Tweets发送者的概要信息,如性别及个性特点等,并显示在地图底部。从下拉菜单中选择参与服装品牌,在不同零售商之间轻松比较Tweets提及率和及其客户特点。从更微观的角度,实验室的心理分析与来自Esri Tapestry人口统计数据分析可以并发执行分析得出结果,这个结果可以整合买主本质特征,在个体层面进行数据梳理,为品牌经理提供了一个客户关系管理的超强工具。
监控危机范围
Esri及IBM舆情监控示范实验分别按照品牌的正面提及和负面提及做了划分,并在地图上显示出来
对参加舆情监控实验的一家服装零售商而言,2013年的某一周就像是永远。2013年,该公司因某签名品牌的服装的一个瑕疵而遭到了连珠炮式的投诉。
可以预见的是,在美国某些地区,通过Tweets活动进行品牌监测的现象会增加,这些地区的位置将在舆情监控地图上表示出来。通过地理位置显示Tweets信息,可以了解不同地域的人们对产品瑕疵的反映,对社交媒体进行分析可以为在出现危机时第一时间实施品牌管理提供有利的实时信息。
“GIS可帮助确定问题的范围。”IBM加速发现实验室研究人员兼数据整合专家Mary Roth说,“结合我们的分析,Esri可快速确定这股Tweets风暴来自何方,比如说,如果只是来自罗德岛,地理处理数据会显示出该问题只是地方性问题而没有蔓延至全国。重要的是,这样的信息最终会降低响应成本。”
舆情监控示范是从Twitter信息源中提取和展示分析结果的最简单有效的方法。一旦Tweets信息的价值被发现,品牌经理就可通过研究Tweets发送者的个性特点和人口统计资料进行深入的数据挖掘,但是显示在地图中的数据不会泄露任何用户的隐私。这种方法为各公司彻底了解其客户提供了依据,并借此量身定制其品牌形象,更快、更有针对性地对品牌危机做出反应。
针对所有人的大数据分析
尽管有点吓人,但数据洪流仍为以前不可能进行的研究创造了新的机遇,而不再是陈旧零碎的分析。舆情监控仅是大数据研究的冰山一角,Esri和IBM目前正在设计新的大数据分析方法,该方法将地理分析与其合作研发的方法体系结合在一起。今年,Esri将在进一步加强在此领域的研究,并将发布一系列革命性的针对大数据研究的新工具和方法。
CDA学员免费下载查看报告全文:2026全球数智化人才指数报告【CDA数据科学研究院】.pdf
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在大数据技术飞速迭代、数字营销竞争日趋激烈的今天,“精准触达、高效转化、成本可控”已成为企业营销的核心诉求。传统广告投放 ...
2026-04-24在游戏行业竞争白热化的当下,用户流失已成为制约游戏生命周期、影响营收增长的核心痛点。据行业报告显示,2024年移动游戏平均次 ...
2026-04-24 很多业务负责人开会常说“我们要数据驱动”,最后却变成“看哪张报表数据多就用哪个”,往往因为缺乏一套结构性的方法去搭建 ...
2026-04-24在Power BI数据可视化分析中,切片器是连接用户与数据的核心交互工具,其核心价值在于帮助使用者快速筛选目标数据、聚焦分析重点 ...
2026-04-23以数为据,以析促优——数据分析结果指导临床技术改进的实践路径 临床技术是医疗服务的核心载体,其水平直接决定患者诊疗效果、 ...
2026-04-23很多数据分析师每天盯着GMV、DAU、转化率,但当被问到“哪些指标是所有企业都需要的”“哪些指标是因行业而异的”“北极星指标和 ...
2026-04-23近日,由 CDA 数据科学研究院重磅发布的《2026 全球数智化人才指数报告》,被中国教育科学研究院官方账号正式收录, ...
2026-04-22在数字化时代,客户每一次点击、浏览、下单、咨询等行为,都在传递其潜在需求与决策倾向——这些按时间顺序串联的行为轨迹,构成 ...
2026-04-22数据是数据分析、建模与业务决策的核心基石,而“数据清洗”作为数据预处理的核心环节,是打通数据从“原始杂乱”到“干净可用” ...
2026-04-22 很多数据分析师每天盯着GMV、转化率、DAU等数字看,但当被问到“什么是指标”“指标和维度有什么区别”“如何搭建一套完整的 ...
2026-04-22在数据分析与业务决策中,数据并非静止不变的数值,而是始终处于动态波动之中——股市收盘价的每日涨跌、企业月度销售额的起伏、 ...
2026-04-21在数据分析领域,当研究涉及多个自变量与多个因变量之间的复杂关联时,多变量一般线性分析(Multivariate General Linear Analys ...
2026-04-21很多数据分析师精通描述性统计,能熟练计算均值、中位数、标准差,但当被问到“用500个样本如何推断10万用户的真实满意度”“这 ...
2026-04-21在数据处理与分析的全流程中,日期数据是贯穿业务场景的核心维度之一——无论是业务报表统计、用户行为追踪,还是风控规则落地、 ...
2026-04-20在机器学习建模全流程中,特征工程是连接原始数据与模型效果的关键环节,而特征重要性分析则是特征工程的“灵魂”——它不仅能帮 ...
2026-04-20很多数据分析师沉迷于复杂的机器学习算法,却忽略了数据分析最基础也最核心的能力——描述性统计。事实上,80%的商业分析问题, ...
2026-04-20在数字化时代,数据已成为企业决策的核心驱动力,数据分析与数据挖掘作为解锁数据价值的关键手段,广泛应用于互联网、金融、医疗 ...
2026-04-17在数据处理、后端开发、报表生成与自动化脚本中,将 SQL 查询结果转换为字符串是一项高频且实用的操作。无论是拼接多行数据为逗 ...
2026-04-17面对一份上万行的销售明细表,要快速回答“哪个地区卖得最好”“哪款产品增长最快”“不同客户类型的购买力如何”——这些看似复 ...
2026-04-17数据分析师一天的工作,80% 的时间围绕表格结构数据展开。从一张销售明细表到一份完整的分析报告,表格结构数据贯穿始终。但你真 ...
2026-04-16