
基于你的点赞轨迹,数据挖掘可以探知你的性格秘密
整理了一些社交媒体数据挖掘的结果,你会发现,大数据、行为痕迹和社交媒体的结合,展现了无限的机会和可能。例如,基于脸书的挖掘,可以探知你的智商、神经质、生活满意度、宗教信仰、单身与否、身材发福、产后郁郁、话题偏好和舆情监测等。
美国科学院院报(PNAS)最近的一篇研究表明,在社交网站上别轻易点赞,因为点赞能够泄露你一些比较私密的性格特质。基于社交网站上(例如 Facebook)的点赞,可以计算出你的性格特征(大五人格The Big Five),通过算法计算的结果比你的朋友、同学、亲人判断的更准。
研究过程。具体的做法就是,作者邀请脸书上8.6万志愿者参与一项性格测试,并且收集了他们的“点赞”数据(即对什么帖子或内容发生点赞行为)。并 且邀请了被试的亲朋好友参与测试,给出有关该被试性格的评价。这样就有关于被试的三份性格数据,一份是自我的评价,一份是亲朋好友的评价,一份是基于点赞 数据计算的结果。研究结果表明,算法得到的性格倾向指数比亲朋好的判断更为准确。
点赞和特质。点赞的时候,我们希望向脸书好友展示我们对特定内容(包括状态更新、照片、书籍、产品、音乐)的积极态度。但是,与此同时,“点赞”行 为也暴露了你很多的私密信息、敏感特质、性格偏好和行为倾向等。例如宗教信仰、政治观点、性取向和酒量等。而且,通常一个点赞(例如点赞了某一篇分享)就 能够产生较为精准的预测。一些结论举例如下。
具体的,大概只需要10个“赞”,计算机就能比同事更准确的判断你的性格。通过70个“赞”,电脑就能超过其朋友。140个“赞”便超过其家人(父母亲兄妹)。300个“赞”则能“击败”你的伴侣。
状态更新和单身判断。发现颜高妹子的时候,小伙伴们冒出的第一个念头,她是不是单身哈。告诉你一个福音,脸书帮你解决这个问题了。
脸书通过上百万的状态更新的数据,基于更新内容进行文本分析,识别一些特征变量,从而判断和预测用户何时从单身状态变成恋爱中状态。进一步地,脸书 联合企业将研究结论进行商业应用,即向个人页面首页投放相关的产品广告。例如,向恋爱中的用户提供产品(买一赠一、情侣折扣等),或者向失恋的用户提供产 品(纸巾、Ben&Jerry的冰激凌等)。
朋友圈,你常常会收藏一些内容和文档。其实,通过你的收藏,也是可以判断你高度敏感的个人特征的。例如性取向、生活满意度、智力、情感稳定性、宗教信仰、过度饮酒习惯、年龄、性别、种族、政治观点等。
脸书上每个人都需要上传自己的头像。基于用户的头像,脸书可以做什么事情呢?人脸识别技术。
人脸识别是指,基于面部特征,分析五官的相对位置、尺寸、形状等,保存最为突出的特点,将图像数据转化为矩阵数据,以便面部识别。
对用户的头像进行人脸识别后,脸书会检索整个互联网,看看这些照片还在哪里出现过,看看是否出现在别人的合影中,猜测你可能会认识哪些人,从而向你推荐一些二度三度的朋友。
另外一方面,脸书也会将照片与公司网站、在线相亲网站进行匹配,或者从最新发表的博客或文章中寻找有关你的更多的信息。从而了解你的职业、兴趣、偏好和行为倾向等。
谷歌眼镜和社交媒体。之前看过一个视频,描绘的就是一个小伙伴带上谷歌眼镜后,遇到一个陌生人,迅速通过谷歌眼镜找到很多有关这个陌生人的信息。想在想一想,这也是可以实现的。
谷歌眼镜需求和脸书的合作。谷歌自己开发了一套Nametag技术。基于该技术,当遇到陌生人时,谷歌眼镜通过拍照,把人脸上传,丢到脸书上进行人脸识别。从而匹配到该陌生人的职业、年龄、生日、动态、朋友圈、日志、状态和最近的兴趣等。
现在有些公司,借助社交媒体内容,进行潜在员工的筛选。招聘方通过个人资料,例如脸书,抓取脸书上的个人信息,基于信息和网络环境中个体表现出来的特质,判断和预测个体的智力水平和情绪稳定性。从而作为员工录用的一个参考的标准。
头像变化分析。在脸书上,每个人的头像都不会一成不变的,间隔一段时间,大家就会采用新的头像或自拍照。你在进行头像更新时,脸书就在思考另外一件事,即他们通过人脸识别技术,判断前后头像是否存在差别,即你是否变胖了。
如果图像分析的结果表明,你确实发福了,恰好你的性别又是女性的话,脸书很可能就会联合一些减肥、健身、保健公司,向你的个人页面,精准的推送一些折扣券。
越来越多的公司关心员工的福祉,关心员工的生活状态,并且及时的进行涉入和干预,以便你快乐工作和快乐生活。
一家公司就通过分析女性员工社交媒体上的发帖和话题(例如微博、脸书、Twitter)来判断她们是否存在陷入产后抑郁症的风险。通过抓取女性员工在生产前后几周在社交媒体上的话题和发言,摘取其所使用的动词。
分析结果表明,有抑郁症倾向的母亲常常会使用暗示“焦虑”和“不高兴”的话。发言中一般会包含一些贬义词,例如“失望”、“痛苦”、“讨厌”等,暗示着失望情绪的疯长。
2013年台风席卷菲律宾时,通过社交媒体脸书上PO的照片数据,人们绘制一幅救灾线路图。
发生灾难时,人们常常会将自己亲身经历的照片、文本、视频发布到社交媒体上。研究者们对人们上传的照片进行分析和挖掘。对于一张受灾照片,“损害程 度如何?通过点击按钮确定,无、中度、严重”。对于Facebook或Twitter文本信息,判断文本的类型即“寻求帮助”、“基础设施损坏”、“人口 流失”、“相关但属于其他”等分类。
然后通过确认数据来自菲律宾的哪个地方,通过照片或文本发送时携带的GPS传感信息来定位,从而绘制一个受灾地图。
通过这个救灾地图,就可以得知,谁需要什么、谁需要食物、尸体在哪里、哪里有流离失所的人、哪里受到的灾难较为严重、什么医院损伤最小。从而为救灾提供了最一手、最新鲜的信息。
很多公司目前都跟在踪和监测社交媒体上与品牌相关的词汇(产品、品牌、竞争者、品牌代言人、政策趋势等),并进行情感和话题分析,了解人们在网络上如何讨论公司及其产品。
社交媒体也是一个早期的预警系统。当消费者对产品或服务不太满意时,他们会在社交媒体上吐槽,企业迅速捕捉此类信息,并且进行产品服务改良,控制负面消息的扩散和传播。
通过社交媒体的这些案例,想要表达什么呢?大概几点。
第一,不管你有没有意识,你的很多行为都会留下数字痕迹。文本(微博)、视频(优酷土豆等)、音频(客服电话)、图片(朋友圈)、传感器数据(手环、手机内置的传感器)等。
第二,别否认,机器和算法有时候更懂你。
第三,算法是理性的,智能是性感的。并且,算法和智能是相伴而生的。
第四,延伸来说,基于数据挖掘,计算机是能够推断出你我的心理特质的。更进一步,如果计算机能根据个人性格特质做出匹配性的响应,那么它就真的成为具有情感和社交能力的智能产物了。
不知道大家是否看过电影《她Her》、《机械姬Ex Machina》(注:年度科幻电影排名前五),《她》里面基于人工智能虚拟的Dream Girl,绝对是你完美的伴侣。
第五,最后一点也是最为重要的一点,好歹我也辛辛苦苦梳理了这么多的资料,看完记得点赞哈。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
破解游戏用户流失困局:从数据洞察到留存策略 在游戏行业竞争白热化的当下,用户流失率已成为衡量产品健康度的核心指标。一款游 ...
2025-08-11PyTorch 中 Shuffle 机制:数据打乱的艺术与实践 在深度学习模型训练过程中,数据的呈现顺序往往对模型性能有着微妙却关键的影响 ...
2025-08-11数据时代的黄金入场券:CDA 认证解锁职业新蓝海 一、万亿级市场需求下的数据分析人才缺口 在数字化转型浪潮中,数据已成为企业核 ...
2025-08-11DBeaver 实战:实现两个库表结构同步的高效路径 在数据库管理与开发工作中,保持不同环境(如开发库与生产库、主库与从库)的表 ...
2025-08-08t 检验与卡方检验:数据分析中的两大统计利器 在数据分析领域,统计检验是验证假设、挖掘数据规律的重要手段。其中,t 检验和卡 ...
2025-08-08CDA 数据分析师:解锁数据价值的专业力量 在当今这个数据爆炸的时代,数据已成为像石油一样珍贵的战略资源。而 CDA 数据分析师, ...
2025-08-08人工智能对CDA数据分析领域的影响 人工智能对 CDA(Certified Data Analyst,注册数据分析师)数据分析领域的影响是全方位、多层 ...
2025-08-07SPSS 语法使用详解 在当今数据驱动的时代,SPSS( Statistical Package for the Social Sciences)作为一款功能强大的统计分析软 ...
2025-08-07SASEM 决策树:理论与实践应用 在复杂的决策场景中,如何从海量数据中提取有效信息并制定科学决策,是各界关注的焦点。SASEM 决 ...
2025-08-07CDA含金量分析 在数字经济与人工智能深度融合的时代,数据驱动决策已成为企业核心竞争力的关键要素。CDA(Certified Data Analys ...
2025-08-07大数据时代对定性分析的影响 在大数据时代,海量、多样、高速且低价值密度的数据充斥着我们的生活与工作。而定性分析作为一 ...
2025-08-07K-S 曲线、回归与分类:数据分析中的重要工具 在数据分析与机器学习领域,K-S 曲线、回归和分类是三个核心概念与工具,它们各 ...
2025-08-07CDA 数据分析师考试全解析 在当今数字化时代,数据已成为企业发展的核心驱动力,数据分析师这一职业也愈发受到重视。CDA 数据分 ...
2025-08-07大数据时代的隐患:繁荣背后的隐忧 当我们在电商平台浏览商品时,系统总能 “精准” 推送心仪的物品;当我们刷短视频时,算法 ...
2025-08-07解析 F 边界检验:协整分析中的实用工具 在计量经济学的时间序列分析中,判断变量之间是否存在长期稳定的均衡关系(即协整关系) ...
2025-08-07CDA 数据分析师报考条件详解:迈向专业认证的指南 在数据分析行业蓬勃发展的当下,CDA 数据分析师认证成为众多从业者提升专业 ...
2025-08-07通过 COX 回归模型诊断异常值 一、COX 回归模型概述 COX 回归模型,又称比例风险回归模型,是一种用于生存分析的统计方法。它能 ...
2025-08-07评判两组数据与初始数据准确值的方法 在数据分析与研究中,我们常常会面临这样的情况:需要对通过不同方法、不同过程得到的两组 ...
2025-08-07CDA 数据分析师行业标准:构建数据人才的能力坐标系 在数据驱动决策成为企业核心竞争力的时代,CDA(数据分析师)行业标准作为 ...
2025-08-07反向传播神经网络:突破传统算法瓶颈的革命性力量 在人工智能发展的历史长河中,传统算法曾长期主导着数据处理与模式识别领域 ...
2025-08-07