
大数据时代的未来婚恋_你骗不了你的过往
最近与相恋四年的女友间歇性吵架,作为心智不全的低龄表现,我赌气性地上了某婚恋网站。然而,当我真正点开网页,看到如无痛人流广告一般的页面设计(那种最烂俗的粉),以及满屏幕冲我傻笑的头像,脑中回荡一种声音:嘿,关了吧,这不是正经人待的地儿。
这当然不是婚恋网站的错,只是有悖我心中对“寻觅知己”的优雅想象。诚恳地说,我无心在海量异性资料中疲于搜索——尤其当这些资料大多为“吃货” “宅”“旅行”“读书”“电影”“有魄力”“开朗”……若你像我一样,认为恋人之间尽可能的彼此了解是同住一屋檐的基石,又不太相信“平凡是唯一答案”, 那么当你看到这些廉价的标签,不免陷入某种绝望——从头了解一个人要耗费大量成本,而我对这个过程毫无兴趣。
于是,我一边觉得愧对女友,一边开始琢磨,未来专业的数据挖掘技术,能否把成本降到最低?
告别谎言
首先在我看来,若想维持一段长久的婚姻关系,贴标签本身是非常好的过滤器,我相信两个“中医粉”或者两个“反中医”在一起都能免去不少无谓的口水之争,某种意义上,价值观相近其实就是由一个个具体“标签”——或者说侵入大脑的一个个具体“模因”的“兼容”程度所体现。
但作为人类有史以来产生谎言最多的领域之一,你永远都要对寻偶过程中一个人的言行举止保持警惕:电视上的相亲节目是一种人格表演,而婚恋网站的自我展示和贴标签则更像另一种隐性表演:相信我,人性复杂幽暗,没人可以完全赤裸地真实描述自己。
譬如,一些网站也在用匹配程度牵桥搭线,如自称是“地球上最好的约会网站”OkCupid,注册用户要回答非常多的问题,且看似事无巨细,如“若你 知道某人曾吸过毒,你还和他交往么”“看到陌生人随地乱扔垃圾你第一感觉是?”OkCupid试图通过用户的“自我暴露”来勾勒三观,进而找到匹配对象, 而这需要大概半小时左右。
也许是我错了,但基于对人性的“悲观”和不确定性,我始终认为,你的过往比你的自我描述更加值得信赖,而随着“数字化生存”的日趋明显,某种程度上,你在网上留下的蛛丝马迹,使得数据在判断“你到底是怎样的人”这件事上更具发言权。
那么,在未来,如何基于大数据找到你的伴侣?不妨想象一下。
多维搜索
毫无疑问,真正的大数据一定是跨平台的,这有赖于未来职业数据挖掘行业的崛起(起初也许处于灰色地带),他们如同侦探一样,可以搞到一个人的几乎所有数据,再卖给其他行业公司,如婚恋网站。
首先是基因信息。随着人体密码日趋告别神秘,如凯文凯利所言:个人DNA副本在今天十分昂贵,但不久后便不再如此,制药公司会付钱购买你的基因序 列。数据公司自然也有办法,而以前诸多研究证明,两人成为夫妻,不仅因为投缘,相比陌生人,基因也更加匹配。基因信息自然会成为婚恋网站匹配度算法的重要 依据(对于非丁克用户,基因信息则尤为关键)。
当然,基因只是一个维度,两人在一起还要三观相符,生活方式没有太多冲突,这在过往数据中也有迹可循,随便举些例子:
1,通过微博、微信、Instagram等社交软件的关注圈子和发表内容,固定浏览的网页,常用APP等,大体判断兴趣爱好和价值取向。
2,通过大众点评等生活信息网站,大体判断饮食口味。
3,通过票务网站等,大体判断是否有旅行习惯。
4,通过晚上12点之后的在线频率,大体判断作息时间。
5,通过豆瓣上的记录,可以全方位还原一个人的文娱和阅读偏好,这个很重要,事关三观。
6,通过上色情网站的频率,大体判断性欲,这个更重要(甚至通过在不同Categories上的停留时间,大体判断一个人偏好的体位和口味)。
…………
单子可以无限列下去,它几乎可以渗透任何角落——在大数据时代,你骗不了你的过往,你的过往在勾勒你的人格——至少是比特世界的人格。基于这些多维数据,婚恋网站可以通过算法,为每一个用户做到真正意义上的精确推荐——这或许是付费的,完美的答案本身就是一种优质商品。
另外,在我对交友网站的想象中,它应拥有简洁优雅的页面,用户照片甚至可以在推荐结束之后才出现。最后,你得到的推荐人选或许并没有多少,除非你放宽具体某项需求——就像你在淘宝买东西一样。
嗯,说到这里,不少人已经开始义愤填膺了。这样的速配是爱情么!?爱情不是你想卖,想买就能卖!
我个人的回答是,作为一段契约关系,无论与他人共度一时还是一世,都无比重要,还是谨慎点儿好。我不太相信顺其自然或缘从天降,更对“婚姻怎么选都 是错,长久的婚姻就是将错就错”持怀疑态度。科技本质上就是让人类有更多选择,倘若通过科技,让人不管走过多少桥,看过多少云,喝过多少酒,都可以在当下 找到最合适的对方——哪怕只是纯粹理论上的,也算功德一桩。
接下来的疑问是,面对不靠谱的人性,单凭数据究竟能匹配到什么程度?(譬如考虑到诸如“眼缘”等非理性因素,数据匹配不代表见到对方不会想吐)只有 试过才知道。其实,基于大数据的多维搜索,可用于寻觅任何关系,朋友,情人,哪怕仅仅是下一次远行的伙伴——互联网总会让气味相投之人迅速找到彼此,所谓 自由人的自由联合。
轮转婚姻
最后有一个甜蜜的烦恼,系统推荐的匹配人选可能不止一个,哪怕不多,但作为在两性关系上颇具探索精神的人类,无论你与谁相伴,心中都有个隐秘的声音在勾搭你:嘿,除了她(他)还有几位不错的人选适合你哦,你甚至知道她(他)在哪里哦。
如果考虑到夫妻彼此之间性吸引力终将下降的无奈事实(从这个角度,“长久的婚姻就是将错就错”倒也没错),为一份契约真正加上一个期限或许是不错选 择。你知道,在鸡汤界有个传说:爱尔兰实行期限婚姻制,男女双方在缔结婚约时可协商决定婚姻期限,从1年到100年,期限届满关系即终止,双方如有继续共 同生活愿望,可办理续约。
当然没这回事,但你可以把它当科幻故事看。随着互联网对人类各种组织的瓦解,这并非不可能。一夫一妻制更多是文化的产物,或者说是男人之间为了维持 社会稳定达成的一种协议,但正如罗伯特·赖特在《道德动物》中提到的:高度社会等级分层和一夫一妻制并存的社会具有人为性,一夫多妻制总固执潜藏——譬如 自愿选择当个情妇,只要经济分层,想调和终身一夫一妻制和天性的矛盾将面临巨大挑战。
我当然不是在鼓吹一夫多妻制。事实上,由于互联网技术,未来或许会诞生更好的婚姻制度。哪怕没有,也不妨YY一下:譬如,轮转婚姻——由于已知世间 存在数位与你各方面匹配之人,为了完善生命体验,可以效仿爱尔兰鸡汤,实行期限婚姻制,到期后双方都可更换匹配对象(你必须战胜人类不愿与熟人断绝往来的 本能,有时一段关系——如离婚,理性上是你想要,真正分离依旧难受),类似长久版的八分钟约会——想象一下,一个人可以与不同知己轮流度过匆匆一生,可谓 近乎无憾。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
机器学习解决实际问题的核心关键:从业务到落地的全流程解析 在人工智能技术落地的浪潮中,机器学习作为核心工具,已广泛应用于 ...
2025-09-09SPSS 编码状态区域中 Unicode 的功能与价值解析 在 SPSS(Statistical Product and Service Solutions,统计产品与服务解决方案 ...
2025-09-09CDA 数据分析师:驾驭商业数据分析流程的核心力量 在商业决策从 “经验驱动” 向 “数据驱动” 转型的过程中,商业数据分析总体 ...
2025-09-09R 语言:数据科学与科研领域的核心工具及优势解析 一、引言 在数据驱动决策的时代,无论是科研人员验证实验假设(如前文中的 T ...
2025-09-08T 检验在假设检验中的应用与实践 一、引言 在科研数据分析、医学实验验证、经济指标对比等领域,常常需要判断 “样本间的差异是 ...
2025-09-08在商业竞争日益激烈的当下,“用数据说话” 已从企业的 “加分项” 变为 “生存必需”。然而,零散的数据分析无法持续为业务赋能 ...
2025-09-08随机森林算法的核心特点:原理、优势与应用解析 在机器学习领域,随机森林(Random Forest)作为集成学习(Ensemble Learning) ...
2025-09-05Excel 区域名定义:从基础到进阶的高效应用指南 在 Excel 数据处理中,频繁引用单元格区域(如A2:A100、B3:D20)不仅容易出错, ...
2025-09-05CDA 数据分析师:以六大分析方法构建数据驱动业务的核心能力 在数据驱动决策成为企业共识的当下,CDA(Certified Data Analyst) ...
2025-09-05SQL 日期截取:从基础方法到业务实战的全维度解析 在数据处理与业务分析中,日期数据是连接 “业务行为” 与 “时间维度” 的核 ...
2025-09-04在卷积神经网络(CNN)的发展历程中,解决 “梯度消失”“特征复用不足”“模型参数冗余” 一直是核心命题。2017 年提出的密集连 ...
2025-09-04CDA 数据分析师:驾驭数据范式,释放数据价值 在数字化转型浪潮席卷全球的当下,数据已成为企业核心生产要素。而 CDA(Certified ...
2025-09-04K-Means 聚类:无监督学习中数据分群的核心算法 在数据分析领域,当我们面对海量无标签数据(如用户行为记录、商品属性数据、图 ...
2025-09-03特征值、特征向量与主成分:数据降维背后的线性代数逻辑 在机器学习、数据分析与信号处理领域,“降维” 是破解高维数据复杂性的 ...
2025-09-03CDA 数据分析师与数据分析:解锁数据价值的关键 在数字经济高速发展的今天,数据已成为企业核心资产与社会发展的重要驱动力。无 ...
2025-09-03解析 loss.backward ():深度学习中梯度汇总与同步的自动触发核心 在深度学习模型训练流程中,loss.backward()是连接 “前向计算 ...
2025-09-02要解答 “画 K-S 图时横轴是等距还是等频” 的问题,需先明确 K-S 图的核心用途(检验样本分布与理论分布的一致性),再结合横轴 ...
2025-09-02CDA 数据分析师:助力企业破解数据需求与数据分析需求难题 在数字化浪潮席卷全球的当下,数据已成为企业核心战略资产。无论是市 ...
2025-09-02Power BI 度量值实战:基于每月收入与税金占比计算累计税金分摊金额 在企业财务分析中,税金分摊是成本核算与利润统计的核心环节 ...
2025-09-01巧用 ALTER TABLE rent ADD INDEX:租房系统数据库性能优化实践 在租房管理系统中,rent表是核心业务表之一,通常存储租赁订单信 ...
2025-09-01