
大数据奇葩说:盘点10个有趣的大数据
大数据早已成了我们耳熟能详的词汇,大数据也逐渐得到的政府,企业和个人的重视。基于此,大数据究竟在如何影响着我们的生活?
大数据(Big data)
因为他,我们的生活是否变得更舒适?亦或,从此我们的生活细节都要暴露在数据的分析之下?我们该如何正确认识大数据?现在,先让我们了解一些真实的大数据的例子。
从地球到月球的距离
如果我们将一天内产生的数据全部烧录进DVD光碟内,那这些光碟叠起来可以搭成地表到月球的DVD高塔,而且还是双塔。
大数据与星星
根据IDC的分析,2008年时数码数据量就超过了目前已知的宇宙内星星数量,而且以数据成长的速度,2023年时全球数据量将会超过亚佛加厥常数(Avogadro's number)--也就是6.022×10^23。
亚佛加厥常数
男性内裤销量反映经济形势
已故美联储前主席格林斯潘(Alan Greenspan)曾提出过一个著名的"男性内裤销量反映经济形势"的理论。即经济形势良好,内裤销量会平稳上升,反之则下降。
原因很简单,经济萧条时,男性会节俭开支,少买内裤。。。
啤酒与尿布
这是个经典的商场数据分析案例。在上世纪90年代,美国沃尔玛的超市管理人员分析销售数据时发现了一个令人难于理解的现象:在某些特定的情况下,"啤酒"与"尿布"两件看上去毫无关系的商品会经常出现在同一个购物篮中。
啤酒与尿布
在美国有婴儿的家庭中,一般是母亲在家中照看婴儿,年轻的父亲前去超市购买尿布。父亲在购买尿布的同时,往往会顺便为自己购买啤酒,这样就会出现啤酒与尿布这两件看上去不相干的商品经常会出现在同一个购物篮的现象。
第2页:女性头发与经济波动,手纸与肥皂
女性头发与经济波动
据日本最大日用品制造公司"花王",于1987年开始在东京银座对1000名,二十至三十岁女性进行的年度民调后汇编的"发型统计"显示,他们偏好蓄长发时显示经济在复苏中,反之则经济仍在恶化。
比如,1997年,留短发的比蓄长发的人多,那年为日本经济"最差"的一年,2008年经济有所起色,超过八成受访女性头发都很长。
手纸与肥皂
双十一海报
去年“双十一”(11.11)这一天,京东商城卖出了80万块香皂,重量约115吨,相当于23头大象;基情无限的同时,手纸卖出900万卷,8亿多抽手纸,按一秒钟扯一抽的话,至少要扯3年,按一卷纸30米算,900万卷至少可绕地球7圈。
处女座与小龙虾
根据"首届小龙虾美食节"的"小云WiFi美食大数据"显示,女性对美食喜欢程度超过男性,66%的女性喜欢吃小龙虾;而在年龄统计中发现,20-25岁的美食达人最多,处女座是所有星座中最爱食用小龙虾的人群。
一位美食大V不无严肃的认为,从一个侧面说明现在商家的小龙虾的制作工艺、烹饪方式已经达到了一定的高水准,"毕竟处女座的追毛求疵的性格是不争的事实"。
女服务员与股市
在这个刷脸的时代,容貌早已成了求职的隐形标准(不过凤姐当上凤凰客户端主笔,理当另说)。据纽约观察员的解读,当美艳的女服务员随店可见时,经济必陷困境,反之则显示经济兴旺,换句话说,当你到处碰见美女服务员,便可考虑抛售股票。
服务员与股市
该观察员的解释是,当经济红火,颇有点"资本"的女性很容易找到工作环境舒适的工作,诸如商品模特、推销员等。此外,男性经济宽裕后也更容易"金屋藏娇"。
大数据遇到爱情
美国波士顿数学家克里斯·麦金利(Chris McKinlay)注册一个婚恋网站后,认为他们的配对模式不合适,于是他自己写程序,只花了不到90天时间就在茫茫人海中找到了心仪的对象。
这位克里斯开设了12个账户,利用计算机程序随意作答网站的配对问卷,从2万名用户中收集到600万条问题的答案,然后利用演算程序筛选出5000名住在美国的活跃用户,从中按性格分类又选出最符合择偶条件的2组女子。
第3页:看完速7,去速8;大数据遇上爱情
之后克里斯又创建了两个账号,诚实地回答这两类姑娘们最关注的500个问题。回答完问题后,他发现和自己匹配度在90%以上的超过10000人,最高匹配度达到了99%。
克里斯·麦金利
为了获得这些姑娘们的关注。克里斯编了一个新程序,自动访问与他匹配度高的对象,对方回访他的页面时,就会给他留言。
在经过不少尝试后,克里斯终于约到一名亚裔女孩。他见面时主动披露破解网站的秘诀,对方极为欣赏,二人开始恋爱关系。并在恋爱一周年后克里斯求婚成功,二人终成眷属。如此"用心",也是醉了。
食色性也 "看完速7,去速8"
《速度与激情7》
食色性也:凡是人的生命,不离两件大事:饮食、男女。《速度与激情7》上映时,"看完速7,去速8"一度成为相互调侃的流行语。而日前,猫眼电影整合了2015年上半年的售票数据,做了一个有意思的数据报告。报告根据用户购买电影票的习惯,结合用户在美团上的相关消费行为,发现了有意思的现象。
数据显示,用户在购买电影票的同时,有79%会进行餐饮消费,10%会选择唱K、桌游、足疗等休闲活动,还有11%会选择酒店消费。注意噢,酒店消费里,有81%选择的是"速8"一类的经济型酒店…
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
CDA 数据分析师报考条件详解与准备指南 在数据驱动决策的时代浪潮下,CDA 数据分析师认证愈发受到瞩目,成为众多有志投身数 ...
2025-07-18刚入职场或是在职场正面临岗位替代、技能更新、人机协作等焦虑的打工人,想要找到一条破解职场焦虑和升职瓶颈的系统化学习提升 ...
2025-07-182025被称为“AI元年”,而AI,与数据密不可分。网易公司创始人丁磊在《AI思维:从数据中创造价值的炼金术 ...
2025-07-18CDA 数据分析师:数据时代的价值挖掘者 在大数据席卷全球的今天,数据已成为企业核心竞争力的重要组成部分。从海量数据中提取有 ...
2025-07-18SPSS 赋值后数据不显示?原因排查与解决指南 在 SPSS( Statistical Package for the Social Sciences)数据分析过程中,变量 ...
2025-07-18在 DBeaver 中利用 MySQL 实现表数据同步操作指南 在数据库管理工作中,将一张表的数据同步到另一张表是常见需求,这有助于 ...
2025-07-18数据分析师的技能图谱:从数据到价值的桥梁 在数据驱动决策的时代,数据分析师如同 “数据翻译官”,将冰冷的数字转化为清晰的 ...
2025-07-17Pandas 写入指定行数据:数据精细化管理的核心技能 在数据处理的日常工作中,我们常常需要面对这样的场景:在庞大的数据集里精 ...
2025-07-17解码 CDA:数据时代的通行证 在数字化浪潮席卷全球的今天,当企业决策者盯着屏幕上跳动的数据曲线寻找增长密码,当科研人员在 ...
2025-07-17CDA 精益业务数据分析:数据驱动业务增长的实战方法论 在企业数字化转型的浪潮中,“数据分析” 已从 “加分项” 成为 “必修课 ...
2025-07-16MySQL 中 ADD KEY 与 ADD INDEX 详解:用法、差异与优化实践 在 MySQL 数据库表结构设计中,索引是提升查询性能的核心手段。无论 ...
2025-07-16解析 MySQL Update 语句中 “query end” 状态:含义、成因与优化指南 在 MySQL 数据库的日常运维与开发中,开发者和 DBA 常会 ...
2025-07-16如何考取数据分析师证书:以 CDA 为例 在数字化浪潮席卷各行各业的当下,数据分析师已然成为企业挖掘数据价值、驱动决策的 ...
2025-07-15CDA 精益业务数据分析:驱动企业高效决策的核心引擎 在数字经济时代,企业面临着前所未有的数据洪流,如何从海量数据中提取有 ...
2025-07-15MySQL 无外键关联表的 JOIN 实战:数据整合的灵活之道 在 MySQL 数据库的日常操作中,我们经常会遇到需要整合多张表数据的场景 ...
2025-07-15Python Pandas:数据科学的瑞士军刀 在数据驱动的时代,面对海量、复杂的数据,如何高效地进行处理、分析和挖掘成为关键。 ...
2025-07-15用 SQL 生成逆向回滚 SQL:数据操作的 “后悔药” 指南 在数据库操作中,误删数据、错改字段或误执行批量更新等问题时有发生。 ...
2025-07-14t检验与Wilcoxon检验的选择:何时用t.test,何时用wilcox.test? t 检验与 Wilcoxon 检验的选择:何时用 t.test,何时用 wilcox. ...
2025-07-14AI 浪潮下的生存与进阶: CDA数据分析师—开启新时代职业生涯的钥匙(深度研究报告、发展指导白皮书) 发布机构:CDA数据科 ...
2025-07-13LSTM 模型输入长度选择技巧:提升序列建模效能的关键 在循环神经网络(RNN)家族中,长短期记忆网络(LSTM)凭借其解决长序列 ...
2025-07-11