京公网安备 11010802034615号
经营许可证编号:京B2-20210330
奔波儿灞案:这简直是80后父母的写照:明明对于名字的审美高度雷同,基本上来源不出游戏,言情小说,港台明星,偏却长了一颗自命不凡遗世独立的中二病的心。
-----------------------------------------------------------------------------------------------------------------------------------
大学同学要给孩子起名字,利用工作条件做的统计,非常有意思。经同意后分享给大家。
算算时间不早了,该给我们家**起名字了,于是今天中午利用大数据的优势,做了个无聊的统计。
我抽取了2010年1月1日以后出生的30万小朋友的姓名。
首先,竟然发现男女比例为18:13,可想而知未来男宝宝找对象该有多么困难。其中,姓名为两个字的小盆友有2.5万人,三个字的小盆友有28.1万人,四个字的小盆友有2000多人。四个字的小盆友大部分都是父姓+母姓+两个字的名字。应该说,三个字的小盆友占了绝大多数,竟达到了91%。
四个字的小盆友就算了,我对两个字和三个字的小盆友按照男女性别不同又做了一次划分,统计结果显示:
1、两字名的男宝宝第二个字出现频率最高的前五名分别为“睿”(2.59%)、“浩”(2.56%)、“博”(1.82%)、“瑞”(1.80%)、“昊”(1.78%),也就是说,男宝宝叫hao或者叫rui的占了很大比例。
2、两字名的女宝宝第二个字出现频率最高的前五名分别是“悦”(2.94%)、“妍”(2.45%)、“涵”(2.07%)、“玥”(1.53%)、“蕊”(1.42%),也就是说,女宝宝叫yue的占有相当大的比例。
3、三字名的男宝宝第二个字出现频率最高的前五名分别是“子”(5.93%)、“梓”(3.41%)、“浩”(3.32%)、“宇”(3.07%)、“俊”(2.50%),这一算不得了,竟然有接近十分之一的三字名男宝宝叫什么zi什么。
4、三字名的男宝宝第三个字出现频率最高的前五名分别是“轩”(6.04%)、“宇”(5.16%)、“泽”(2.84%)、“杰”(2.49%)、“豪”(2.19%),这一算也吓了一跳,竟然超过十分之一的三字名男宝宝叫什么什么轩或者什么什么宇。
随后,我又用颤抖的手统计了一下三字名女宝宝的名字,结果更是令我感到震惊:
5、三字名的女宝宝第二个字出现频率最高的前五名分别是“雨”(5.11%)、“梓”(3.69%)、“欣”(3.61%)、“子”(3.58%)、“思”(3.52%),也就是说,三字名女宝宝的中间字是这五个字的比例竟然高达五分之一!
6、三字名的女宝宝第三个字出现频率最高的前五名分别是“涵”(6.75%)、“萱”(3.63%)、“怡”(3.18%)、“彤”(2.66%)、“琪” (2.65%),同样的,这前五名也占了三字名女宝宝的近五分之一人数!其中,叫“涵”的女宝宝比例竟然高达6.75%,真是令人震惊。
本来到这里已经统计结束了,后来发现还有一种更加变态的统计,当我按下运行按钮,出来结果之后,我彻底的惊呆了:
7、三字名男宝宝的名字前六名分别是“浩宇”(0.90%)、“子轩”(0.73%)、“浩然”(0.59%)、“雨泽”(0.55%)、“宇轩”(0.55%)、“子涵”(0.51%)。
8、三字名女宝宝的名字前六名分别是“欣怡”(0.79%)、“子涵”(0.69%)、“梓涵”(0.59%)、“雨涵”(0.51%)、“可馨”(0.46%)、“诗涵”(0.45%)。
这样算下来,我真的是吓了一大跳,叫“子涵”或“梓涵”的小盆友,竟然比例如此之高!那么,你们家小孩的名字是不是在以上行列呢?
而且,大众化的名字很明显地带有时代的气息,与我们这一代的大众化名字多是“峰”、“鹏”、“艳”等等,这在10后小盆友名字中排在了30名以后的位置。而 10后小盆友的大众名“轩”、“涵”、“浩”等等则更像是古装电视剧或游戏中的人物名字。难道10后的小盆友真的是父母练级打怪掉出来的么?
这次统计引起了我的深思,连宝宝的姓名都会随着时代的发展而变化,而事实上或许大多数父母并不曾想到要给孩子起一个大众化的名字,避开了当年大众化的“峰”、“鹏”、“艳”、“丽”,但恰恰是这样的思路,却造成了一个新的时代的大众化潮流。(文章来源CDA数据分析师)
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
【核心关键词】大数据、零售商、消费者、供应链、运营、企业、产品、客户、数据模型、大数据平台、数据开发、系统运维、业务逻 ...
2026-06-26在物流配送、供应链履约、终端供货等业务场景中,送货率是衡量企业履约能力、服务质量、供应链稳定性的核心业务指标,直接关联客 ...
2026-06-26 很多数据分析师精通描述性统计,能熟练计算均值、中位数、标准差,但当被问到“用500个样本如何推断10万用户的真实满意度” ...
2026-06-26在数字化管理与数据化运营体系中,指标是连接原始数据与业务决策的核心载体。零散的原始数据只是无意义的数值堆砌,无法直接反映 ...
2026-06-25在Excel数据汇总、财务统计、业务复盘等日常办公场景中,经常需要完成逐行相乘、整体汇总求和的计算需求,最典型的场景就是:单 ...
2026-06-25 很多数据分析师沉迷于复杂的机器学习算法,却忽略了数据分析最基础也最核心的能力——描述性统计。事实上,80%的商业分析问 ...
2026-06-25【核心关键词】主数据、资产、供应商、现金流、企业、精细化、集团、数字化、中国、数据质量、数据管理、经营管理、地产行业、 ...
2026-06-24在数据分析、假设检验、AB测试、学术研究等统计场景中,显著水平(α)与P值(P-value)是判断统计结果是否具有统计学意义的两个 ...
2026-06-24小李刚入职了一家互联网公司的运营部门。第一次参加业务复盘会,运营主管问了一个看似简单的问题:“这个月新用户留存率下降了5 ...
2026-06-24在数字化转型全面渗透的产业背景下,数据分析已成为互联网、金融、零售、制造等几乎所有行业的核心岗位能力。很多初学者对数据分 ...
2026-06-23在企业并购、股权定价、投融资评估、资产核算等资本市场核心场景中,市场法是应用最广泛、市场认可度最高的企业价值评估方法。传 ...
2026-06-23 许多数据分析师精通Excel函数和SQL查询,但当面对一张上万行的销售明细表,要快速回答“哪个地区销量最高”“哪款产品增长最 ...
2026-06-23【核心关键词】运营、证书、金融、客户、产品、软件、销售额、量化、科技、数据分析、金融行业、证券类软件、业务流程、金融机 ...
2026-06-22在企业方案选型、产品迭代评审、供应商筛选、运营效果复盘等决策场景中,单一指标的优劣判断往往无法支撑科学决策。一套转化效果 ...
2026-06-22 很多数据分析师掌握了Excel函数、会写SQL查询,但当被问到“数据从哪里来”“数据加工有哪些步骤”“如何使用分析工具连接数 ...
2026-06-22【核心关键词】软件、洞察力、大数据、产品、经验、硬件、流量、创新、决策、数据安全、网络安全、数据分析、决策制定、数据挖 ...
2026-06-18在方案选型、效果复盘、产品评估、供应商筛选等各类业务决策场景中,仅凭单一指标下结论往往会陷入 “以偏概全” 的误区。多维度 ...
2026-06-18 很多数据分析师精通Excel单元格操作,但当被问到“表结构数据的基本处理单位是什么”“字段和记录的本质区别”“为什么表结 ...
2026-06-18在数据分析、用户运营与业务增长的工作体系中,漏斗拆解是最基础也最高频的问题定位方法。很多业务场景下,我们只能看到最终的转 ...
2026-06-17在数据库开发、数据清洗与报表统计场景中,数值类型转换为日期是高频刚需操作。业务系统常以 Unix 时间戳、整型日期(如20240617 ...
2026-06-17