京公网安备 11010802034615号
经营许可证编号:京B2-20210330
百度迁徙:透过大数据“看”春运_数据分析师
北京往返成都成最热门线路
平均迁入成都的1000个人中,来自北京的有249个
从成都迁出的1000个人中,到北京的就有329个
你知道吗?如果说昨天从外省市回成都过年的有1000个人的话,那么来自北京的就占到了249个,北京是迁入成都人数最多的一个城市。
随着25日晚百度迁徙上线,不少成都市民都在浏览器键入“qianxi. baidu.com”,查看每天最新的春节人口迁徙动态图。
这是一张中国地图,每个城市如星星一样密布其上,犹如蛛网一样闪光的迁徙线路将它们连接,反映了无数真实个人的实时行程。
目前正值春运进入高峰,每天都有数亿人次在全国各个城市之间迁徙,并随之产生各种各样的相关数据:哪条返乡之路最热?从北京回到哪个城市的人最多?哪个旅游城市今年最受欢迎?这些公众关心的话题其实都可以通过数据反映出来。
大数据可视化是未来的方向,“百度迁徙”全称是“百度地图春节人口迁徙大数据”,全程、即时、动态、直观地展现中国春运的迁徙轨迹与特征。
只要你使用智能手机,并且使用过定位功能,那么,从你踏上旅途的那一刻开始,从出发地到目的地的数据,就会在这张地图上划上一条淡淡的线,人越多这条线就会越亮,可谓时下大数据最鲜活的应用。
北京往返成都成最热门线路
中国春运是世界最大规模的周期性人口迁徙,近年来中国春运人口迁徙超30亿人次,呈逐年上升趋势,预计今年将超过36亿人次,成为全国乃至世界的关注焦点。
昨日华西都市报记者打开百度迁徙看到,可以选择时间精确到小时,再选择城市查询迁徙情况,橙色的线代表迁入人流量,而黄色的线表示迁出人流量。
百度迁徙显示,最热线路排行榜,截至25日晚上七点,八小时之内排在前三位的是上海往返滁州、天津往返德州,成都往返北京。一个有意思的现象是,成都往返北京的线路,已经连续三天占据热门线路前十名,24日甚至排名第一。
据昨日上午10点的数据,在迁入成都的1000个人中,来自北京的占了249个。从成都迁出的1000个人,到北京的就有329个。
快过年了,从北京回流成都的人口居然还没有成都到北京的多?这似乎不符人们的常识。但据成都铁路局的实际统计,从春运开始截止到24日的晚上8点,从成都火车站直达北京的旅客人数比上一年增加3000多人,增幅超过60%。这个统计与百度迁徙的数据非常吻合。
百度大数据反映“逆向过年”
春运30多年来,每到春运前半段,成都火车站面临的最大压力是到达客流带来的。而今年春运,成都火车站在原来的基础上,在送出旅客方面同样要投入更多的精力。
这种与过去不一样的现象是如何产生的呢?据央视播报,也许大数据目前还不能具体分析乘车人的具体身份,不过成都火车站的一线工作人员却有一个特别的发现,那就是今年出发的人流中多了不少老人的面孔,这在以前并不多见,老人挤进春运大军,很多都是要去儿女打工的城市过年。这也印证了之前专家的分析,“逆向迁徙”正在改变着今年的春运。
此外,在北京、上海、天津、武汉、成都、广州等6个城市中,有三成年轻夫妻因为回谁家过年吵过架。是啊,都是独生子女,过年就那么几天,到底该陪谁的爸妈呢?因此越来越多的人就选择自己不回家,把双方父母接到自己工作地的城市过年。
百度地图LBS 开放平台提供支持
据百度相关负责人介绍,百度迁徙的实现原理以春运人口迁徙密集、中国手机渗透率高为大背景,百度对拥有的定位大数据进行全样数据处理、分析和挖掘,数亿部手机定位数据变化,映射为人群迁徙轨迹并可视化。
2014年1月16日,CNNIC发布的《第33次中国互联网络发展状况统计报告》显示,截至2013年12月,我国手机网民达5亿。“手机网民”即是指使用手机上网,也就是可以使用定位服务的网民。
在人群迁徙过程中,通讯是最基本的需求之一,因此手机网民与迁徙人群不仅重合度极高,而且占比极大,完全可以代表迁徙人群(手机网民不一定都迁徙,但迁徙人群绝大多数都是手机网民)。
百度地图LBS 开放平台是中国定位数据源最广的数据平台,该平台为数十万APP提供定位服务,“日处理定位请求35亿次(2013年8月公布数据)”。百度定位服务覆盖数亿部手机,约占手机网民使用设备总量八成(不区分运营商)。
在上述基础上,百度推出“百度地图春节人口迁徙大数据”,它可服务于政府部门科学决策,赋予社会学等科学研究以新的观察视角和方法工具,为公众创造近距离接触大数据的机会,科普数据价值。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在MySQL数据库日常查询、数据统计、后台接口开发、数据导出等场景中,开发者经常需要查询数据表除某几列之外的所有字段。例如查 ...
2026-06-09在Python网络请求、爬虫开发、接口测试、数据抓取等实操场景中,requests库是最常用的第三方请求工具,而content属性是requests ...
2026-06-09 数据分析正在重塑每一个行业。CDA认证的三本官方教材,分别对应Level I、Level II、Level III,为你铺就从业务数据分析到数 ...
2026-06-09在数字财务、智慧财税、业财融合深度推进的当下,传统财务模式下数据标准混乱、业务流程碎片化、知识无法沉淀、系统互通性差等问 ...
2026-06-08随着数字经济深度渗透各行各业,数据正式成为继土地、劳动力、资本、技术之后的第五大生产要素,是企业数字化转型、精细化运营、 ...
2026-06-08 很多数据分析师能熟练写SQL、做透视表,但当被问到“数据是从哪里来的?经过哪些加工才进入数据仓库?ETL具体做了什么?”时 ...
2026-06-08【核心关键词】贷款、报表、课程、专业、建模、缺失值、营销、互联网、银行、办公自动化、数据分析、数据预处理、特征工程、贷 ...
2026-06-05在数据库数据查询、业务报表统计、多表关联分析中,LEFT JOIN左连接是使用率最高的SQL关联查询语句。其核心特性是保留左表全部数 ...
2026-06-05 很多数据分析师能熟练地写SQL、做透视表、算描述性统计,但当被问到“如何预测用户流失概率”“如何归因销量下滑的关键因素 ...
2026-06-05任何一款产品从诞生、普及到最终退出市场,都会遵循一套固定的发展规律,这就是产品生命周期理论。在市场竞争日益激烈、产品迭代 ...
2026-06-04在Excel数据分析、办公统计、业务报表制作场景中,数据透视表是数据汇总、分类统计、快速复盘的核心工具,能够高效完成海量原始 ...
2026-06-04 很多数据分析师拿到数据就开始清洗、建模,但当被问到“这批数据属于什么类型——结构化还是非结构化?分类变量还是数值变量 ...
2026-06-04在问卷调查与社会科学数据分析中,卡方检验是最常用、最基础的非参数检验方法,广泛应用于市场调研、用户分析、行为统计、满意度 ...
2026-06-03【核心关键词】贷款、报表、课程、专业、建模、缺失值、营销、互联网、银行、办公自动化、数据分析、数据预处理、特征工程、贷 ...
2026-06-03 很多数据分析师画过趋势图、做过业绩预测,但当被问到“这个月销售额增长20%,到底是长期趋势自然增长,还是促销活动的短期 ...
2026-06-03逻辑回归是数据分析、机器学习、统计建模中应用最广泛的二分类预测模型,常用于风险判断、行为预测、归因分析等场景。在SPSS、Py ...
2026-06-02数字经济时代,市场竞争日趋同质化,用户消费需求愈发个性化、多元化,传统依托经验、粗放式、广撒网的营销模式弊端日益凸显。长 ...
2026-06-02 很多数据分析师做过按月份的销售额趋势图,画过按天的流量折线图,但当被问到“时间序列和普通数据有什么本质区别”“季节性 ...
2026-06-02在市场竞争日趋饱和、用户需求不断细分的当下,企业创业创新、产品迭代与市场拓展不再依赖经验决策,而是需要系统化、工具化的商 ...
2026-06-01【核心关键词】调度、岗位、数据库、企业、报表、培训、程序、数据分析、数据加工、业务部门、企业数据、调度工具、业务指标、 ...
2026-06-01