
基于你的点赞轨迹,数据挖掘可以探知你的性格秘密
整理了一些社交媒体数据挖掘的结果,你会发现,大数据、行为痕迹和社交媒体的结合,展现了无限的机会和可能。例如,基于脸书的挖掘,可以探知你的智商、神经质、生活满意度、宗教信仰、单身与否、身材发福、产后郁郁、话题偏好和舆情监测等。
美国科学院院报(PNAS)最近的一篇研究表明,在社交网站上别轻易点赞,因为点赞能够泄露你一些比较私密的性格特质。基于社交网站上(例如 Facebook)的点赞,可以计算出你的性格特征(大五人格The Big Five),通过算法计算的结果比你的朋友、同学、亲人判断的更准。
研究过程。具体的做法就是,作者邀请脸书上8.6万志愿者参与一项性格测试,并且收集了他们的“点赞”数据(即对什么帖子或内容发生点赞行为)。并 且邀请了被试的亲朋好友参与测试,给出有关该被试性格的评价。这样就有关于被试的三份性格数据,一份是自我的评价,一份是亲朋好友的评价,一份是基于点赞 数据计算的结果。研究结果表明,算法得到的性格倾向指数比亲朋好的判断更为准确。
点赞和特质。点赞的时候,我们希望向脸书好友展示我们对特定内容(包括状态更新、照片、书籍、产品、音乐)的积极态度。但是,与此同时,“点赞”行 为也暴露了你很多的私密信息、敏感特质、性格偏好和行为倾向等。例如宗教信仰、政治观点、性取向和酒量等。而且,通常一个点赞(例如点赞了某一篇分享)就 能够产生较为精准的预测。一些结论举例如下。
具体的,大概只需要10个“赞”,计算机就能比同事更准确的判断你的性格。通过70个“赞”,电脑就能超过其朋友。140个“赞”便超过其家人(父母亲兄妹)。300个“赞”则能“击败”你的伴侣。
状态更新和单身判断。发现颜高妹子的时候,小伙伴们冒出的第一个念头,她是不是单身哈。告诉你一个福音,脸书帮你解决这个问题了。
脸书通过上百万的状态更新的数据,基于更新内容进行文本分析,识别一些特征变量,从而判断和预测用户何时从单身状态变成恋爱中状态。进一步地,脸书 联合企业将研究结论进行商业应用,即向个人页面首页投放相关的产品广告。例如,向恋爱中的用户提供产品(买一赠一、情侣折扣等),或者向失恋的用户提供产 品(纸巾、Ben&Jerry的冰激凌等)。
朋友圈,你常常会收藏一些内容和文档。其实,通过你的收藏,也是可以判断你高度敏感的个人特征的。例如性取向、生活满意度、智力、情感稳定性、宗教信仰、过度饮酒习惯、年龄、性别、种族、政治观点等。
脸书上每个人都需要上传自己的头像。基于用户的头像,脸书可以做什么事情呢?人脸识别技术。
人脸识别是指,基于面部特征,分析五官的相对位置、尺寸、形状等,保存最为突出的特点,将图像数据转化为矩阵数据,以便面部识别。
对用户的头像进行人脸识别后,脸书会检索整个互联网,看看这些照片还在哪里出现过,看看是否出现在别人的合影中,猜测你可能会认识哪些人,从而向你推荐一些二度三度的朋友。
另外一方面,脸书也会将照片与公司网站、在线相亲网站进行匹配,或者从最新发表的博客或文章中寻找有关你的更多的信息。从而了解你的职业、兴趣、偏好和行为倾向等。
谷歌眼镜和社交媒体。之前看过一个视频,描绘的就是一个小伙伴带上谷歌眼镜后,遇到一个陌生人,迅速通过谷歌眼镜找到很多有关这个陌生人的信息。想在想一想,这也是可以实现的。
谷歌眼镜需求和脸书的合作。谷歌自己开发了一套Nametag技术。基于该技术,当遇到陌生人时,谷歌眼镜通过拍照,把人脸上传,丢到脸书上进行人脸识别。从而匹配到该陌生人的职业、年龄、生日、动态、朋友圈、日志、状态和最近的兴趣等。
现在有些公司,借助社交媒体内容,进行潜在员工的筛选。招聘方通过个人资料,例如脸书,抓取脸书上的个人信息,基于信息和网络环境中个体表现出来的特质,判断和预测个体的智力水平和情绪稳定性。从而作为员工录用的一个参考的标准。
头像变化分析。在脸书上,每个人的头像都不会一成不变的,间隔一段时间,大家就会采用新的头像或自拍照。你在进行头像更新时,脸书就在思考另外一件事,即他们通过人脸识别技术,判断前后头像是否存在差别,即你是否变胖了。
如果图像分析的结果表明,你确实发福了,恰好你的性别又是女性的话,脸书很可能就会联合一些减肥、健身、保健公司,向你的个人页面,精准的推送一些折扣券。
越来越多的公司关心员工的福祉,关心员工的生活状态,并且及时的进行涉入和干预,以便你快乐工作和快乐生活。
一家公司就通过分析女性员工社交媒体上的发帖和话题(例如微博、脸书、Twitter)来判断她们是否存在陷入产后抑郁症的风险。通过抓取女性员工在生产前后几周在社交媒体上的话题和发言,摘取其所使用的动词。
分析结果表明,有抑郁症倾向的母亲常常会使用暗示“焦虑”和“不高兴”的话。发言中一般会包含一些贬义词,例如“失望”、“痛苦”、“讨厌”等,暗示着失望情绪的疯长。
2013年台风席卷菲律宾时,通过社交媒体脸书上PO的照片数据,人们绘制一幅救灾线路图。
发生灾难时,人们常常会将自己亲身经历的照片、文本、视频发布到社交媒体上。研究者们对人们上传的照片进行分析和挖掘。对于一张受灾照片,“损害程 度如何?通过点击按钮确定,无、中度、严重”。对于Facebook或Twitter文本信息,判断文本的类型即“寻求帮助”、“基础设施损坏”、“人口 流失”、“相关但属于其他”等分类。
然后通过确认数据来自菲律宾的哪个地方,通过照片或文本发送时携带的GPS传感信息来定位,从而绘制一个受灾地图。
通过这个救灾地图,就可以得知,谁需要什么、谁需要食物、尸体在哪里、哪里有流离失所的人、哪里受到的灾难较为严重、什么医院损伤最小。从而为救灾提供了最一手、最新鲜的信息。
很多公司目前都跟在踪和监测社交媒体上与品牌相关的词汇(产品、品牌、竞争者、品牌代言人、政策趋势等),并进行情感和话题分析,了解人们在网络上如何讨论公司及其产品。
社交媒体也是一个早期的预警系统。当消费者对产品或服务不太满意时,他们会在社交媒体上吐槽,企业迅速捕捉此类信息,并且进行产品服务改良,控制负面消息的扩散和传播。
通过社交媒体的这些案例,想要表达什么呢?大概几点。
第一,不管你有没有意识,你的很多行为都会留下数字痕迹。文本(微博)、视频(优酷土豆等)、音频(客服电话)、图片(朋友圈)、传感器数据(手环、手机内置的传感器)等。
第二,别否认,机器和算法有时候更懂你。
第三,算法是理性的,智能是性感的。并且,算法和智能是相伴而生的。
第四,延伸来说,基于数据挖掘,计算机是能够推断出你我的心理特质的。更进一步,如果计算机能根据个人性格特质做出匹配性的响应,那么它就真的成为具有情感和社交能力的智能产物了。
不知道大家是否看过电影《她Her》、《机械姬Ex Machina》(注:年度科幻电影排名前五),《她》里面基于人工智能虚拟的Dream Girl,绝对是你完美的伴侣。
第五,最后一点也是最为重要的一点,好歹我也辛辛苦苦梳理了这么多的资料,看完记得点赞哈。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
2025 年,数据如同数字时代的 DNA,编码着人类社会的未来图景,驱动着商业时代的运转。从全球互联网用户每天产生的2.5亿TB数据, ...
2025-06-052025 年,数据如同数字时代的 DNA,编码着人类社会的未来图景,驱动着商业时代的运转。从全球互联网用户每天产生的2.5亿TB数据, ...
2025-05-27CDA数据分析师证书考试体系(更新于2025年05月22日)
2025-05-26解码数据基因:从数字敏感度到逻辑思维 每当看到超市货架上商品的排列变化,你是否会联想到背后的销售数据波动?三年前在零售行 ...
2025-05-23在本文中,我们将探讨 AI 为何能够加速数据分析、如何在每个步骤中实现数据分析自动化以及使用哪些工具。 数据分析中的AI是什么 ...
2025-05-20当数据遇见人生:我的第一个分析项目 记得三年前接手第一个数据分析项目时,我面对Excel里密密麻麻的销售数据手足无措。那些跳动 ...
2025-05-20在数字化运营的时代,企业每天都在产生海量数据:用户点击行为、商品销售记录、广告投放反馈…… 这些数据就像散落的拼图,而相 ...
2025-05-19在当今数字化营销时代,小红书作为国内领先的社交电商平台,其销售数据蕴含着巨大的商业价值。通过对小红书销售数据的深入分析, ...
2025-05-16Excel作为最常用的数据分析工具,有没有什么工具可以帮助我们快速地使用excel表格,只要轻松几步甚至输入几项指令就能搞定呢? ...
2025-05-15数据,如同无形的燃料,驱动着现代社会的运转。从全球互联网用户每天产生的2.5亿TB数据,到制造业的传感器、金融交易 ...
2025-05-15大数据是什么_数据分析师培训 其实,现在的大数据指的并不仅仅是海量数据,更准确而言是对大数据分析的方法。传统的数 ...
2025-05-14CDA持证人简介: 万木,CDA L1持证人,某电商中厂BI工程师 ,5年数据经验1年BI内训师,高级数据分析师,拥有丰富的行业经验。 ...
2025-05-13CDA持证人简介: 王明月 ,CDA 数据分析师二级持证人,2年数据产品工作经验,管理学博士在读。 学习入口:https://edu.cda.cn/g ...
2025-05-12CDA持证人简介: 杨贞玺 ,CDA一级持证人,郑州大学情报学硕士研究生,某上市公司数据分析师。 学习入口:https://edu.cda.cn/g ...
2025-05-09CDA持证人简介 程靖 CDA会员大咖,畅销书《小白学产品》作者,13年顶级互联网公司产品经理相关经验,曾在百度、美团、阿里等 ...
2025-05-07相信很多做数据分析的小伙伴,都接到过一些高阶的数据分析需求,实现的过程需要用到一些数据获取,数据清洗转换,建模方法等,这 ...
2025-05-06以下的文章内容来源于刘静老师的专栏,如果您想阅读专栏《10大业务分析模型突破业务瓶颈》,点击下方链接 https://edu.cda.cn/g ...
2025-04-30CDA持证人简介: 邱立峰 CDA 数据分析师二级持证人,数字化转型专家,数据治理专家,高级数据分析师,拥有丰富的行业经验。 ...
2025-04-29CDA持证人简介: 程靖 CDA会员大咖,畅销书《小白学产品》作者,13年顶级互联网公司产品经理相关经验,曾在百度,美团,阿里等 ...
2025-04-28CDA持证人简介: 居瑜 ,CDA一级持证人国企财务经理,13年财务管理运营经验,在数据分析就业和实践经验方面有着丰富的积累和经 ...
2025-04-27