
交通大数据:大城市交通路在何方
在百度大数据战略会议上,交通运输部科技司司长赵冲久讲解了中国未来的大数据交通战略。众所周知北京的交通一向很糟糕,那么大数据会让这样的大城市交通带向何方?我希望能够从交通大数据的获得,以及对数据的处理上来对其解读,希望国民们都能从一个更宏观层面知道科技与政策的交融的结果,大数据并非玄虚,其实已在我们身边。
一,交通大数据如何获得?
正像赵冲久司长所说的,今后的政策都不再会是拍脑袋决定,而是要根据实实在在的数据来说话,那么交通上的大数据将从以下途径获得。
第一:用户出行的一卡通,以北京为例,交通局有一个终端系统,可以详细的统计出每天进出地铁的人数,每个人在地铁上的行踪都能一清二楚的获得,并且用户使用一卡通做公交车的也是能够统计出来的,但是公交车有个缺点就是有用户可能是不用公交卡出行的,但交通部依然可以根据使用一卡通的人数按一定比例计算出大概的人数。
当然,这里还有一个没有爆发的点NFC的近场支付,如果中国未来可以像日本那样达成全民的NFC支付,那么未来交通部获得的市民出行的数据将更加完善。
第二:运输车辆进行全面监控,目前《道路运输车辆动态监督管理办法》将于今年7月1日起执行,其中最大亮点就是运输车辆的车联网系统,将所有运输车辆都与GPS卫星连接,国家可以实时监控这些运输车辆的路线,这对交通规划是非常好的事情。
第三:车联网,由于车联网的逐渐普及,交通部也能更好的掌握车辆出行的数据,再根据比列进行模拟出大概数据。
第四:路网监控,国家在道路监控上的投入可谓不菲,重庆高速公路视频监控数据每天就达到50T,我们获得了船舶位置数据,航速数据每天就达5500万条,在广州,综合处理服务平台,每日新增城市交通运营数据记录超过12亿,每天数据量达到150到300GB。通过视频监控,交通部能够弥补上其他信息的不足。
第五:与百度的战略合作,这也是百度请交通部来做演讲的原因,百度将自己的地图生态开放给交通部,为其增加数据的渠道来源。百度地图的日请求次数有70亿次(包括手机APP地图,导航等等),拥有大量的用户出行数据,进而诞生了百度迁徙图,而交通部可以根据百度提供的数据来提高数据的可靠性,成为可靠的参考样本,进而做好决策。
此外,还有诸如物流公司的物流信息平台,以及船联网等等可以获取的方式,但不在本次讨论范围。
二,交通大数据的应用是如何?
其实交通部在使用大数据上已经做了很多事情,但是由于数据量的不断增大,自身的分析技术的不足,所以这次与百度共同合作,利用百度对数据的深度分析技术,为政策制定提供更可靠的参考。
当然还有能够帮助交通决策的情况有很多,这里留出最重要的四个部分。
第一:智能公交,这是交通部早已实现的事情,也是交通部最早利用大数据决策的成功案例之一。交通部根据GPS定位技术、3G通信技术、GIS地理信息系统技术等等结合对车辆的监控,实施的公交车智能调度策略,提高了公交车的利用率,同时也在不断减轻城市道路的拥堵负担。
目前智能公交的调度技术已经在绝大多数城市铺展开来,目前中国各个城市都在陆续展开该项目。
第二:用大数据辅助交通规划辅助决策,就公交网络而言,传统的方式需要在投入大量人力进行OD调查和数据收集。而目前的一卡通,则让数据更为全面的展现在决策人员面前,流量数据全部可以精确掌握,同时再利用上车辆拥堵时间,拥堵路段的大数据分析后,公交车的线路调整,增加与减少换乘站的决策就会更加有依据。
第三:对驾驶员评估,交通部与百度技术结合后将通过驾驶员的出行习惯,从路线到行为,为该驾驶员提供一套评估,而此人的评估会被送往交通管理部门以及运输企业等地方,让用人的参考数据更多。并且这些评估也可以为个人提供安全参考意见。
第四:预测群体出行行为,目前百度地图已经做到了可以提前两周预测某个城市的人数大概规模,而将这一成熟的预测算法用于交通后,结合交通部的其他大数据,便可以预测出群体出行的态势,对其可能出行的时间,出行路线,出行方式等等进行预测,从而为城市车辆调度提供决策帮助。
并且再反过来看,这些预测的群体出行行为数据也将为个人出行提供更加精确的服务,帮助个人决策,让个人出行尽量以最短的时间最短的路线抵达目的地。
结语:在我们的不知不觉中,中国已经迅速步入大数据决策的时代,而政府也在利用科技利用大数据对国家进行更科学的建设,而这次政府与百度的合作,可以说是互联网公司有史以来以来与政府政策制定结合的最为紧密的一次。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数据成为新时代“石油”的今天,几乎每个职场人都在焦虑: “为什么别人能用数据驱动决策、升职加薪,而我面对Excel表格却无从 ...
2025-10-18数据清洗是 “数据价值挖掘的前置关卡”—— 其核心目标是 “去除噪声、修正错误、规范格式”,但前提是不破坏数据的真实业务含 ...
2025-10-17在数据汇总分析中,透视表凭借灵活的字段重组能力成为核心工具,但原始透视表仅能呈现数值结果,缺乏对数据背景、异常原因或业务 ...
2025-10-17在企业管理中,“凭经验定策略” 的传统模式正逐渐失效 —— 金融机构靠 “研究员主观判断” 选股可能错失收益,电商靠 “运营拍 ...
2025-10-17在数据库日常操作中,INSERT INTO SELECT是实现 “批量数据迁移” 的核心 SQL 语句 —— 它能直接将一个表(或查询结果集)的数 ...
2025-10-16在机器学习建模中,“参数” 是决定模型效果的关键变量 —— 无论是线性回归的系数、随机森林的树深度,还是神经网络的权重,这 ...
2025-10-16在数字化浪潮中,“数据” 已从 “辅助决策的工具” 升级为 “驱动业务的核心资产”—— 电商平台靠用户行为数据优化推荐算法, ...
2025-10-16在大模型从实验室走向生产环境的过程中,“稳定性” 是决定其能否实用的关键 —— 一个在单轮测试中表现优异的模型,若在高并发 ...
2025-10-15在机器学习入门领域,“鸢尾花数据集(Iris Dataset)” 是理解 “特征值” 与 “目标值” 的最佳案例 —— 它结构清晰、维度适 ...
2025-10-15在数据驱动的业务场景中,零散的指标(如 “GMV”“复购率”)就像 “散落的零件”,无法支撑系统性决策;而科学的指标体系,则 ...
2025-10-15在神经网络模型设计中,“隐藏层层数” 是决定模型能力与效率的核心参数之一 —— 层数过少,模型可能 “欠拟合”(无法捕捉数据 ...
2025-10-14在数字化浪潮中,数据分析师已成为企业 “从数据中挖掘价值” 的核心角色 —— 他们既要能从海量数据中提取有效信息,又要能将分 ...
2025-10-14在企业数据驱动的实践中,“指标混乱” 是最常见的痛点:运营部门说 “复购率 15%”,产品部门说 “复购率 8%”,实则是两者对 ...
2025-10-14在手游行业,“次日留存率” 是衡量一款游戏生死的 “第一道关卡”—— 它不仅反映了玩家对游戏的初始接受度,更直接决定了后续 ...
2025-10-13分库分表,为何而生? 在信息技术发展的早期阶段,数据量相对较小,业务逻辑也较为简单,单库单表的数据库架构就能够满足大多数 ...
2025-10-13在企业数字化转型过程中,“数据孤岛” 是普遍面临的痛点:用户数据散落在 APP 日志、注册系统、客服记录中,订单数据分散在交易 ...
2025-10-13在数字化时代,用户的每一次行为 —— 从电商平台的 “浏览→加购→购买”,到视频 APP 的 “打开→搜索→观看→收藏”,再到银 ...
2025-10-11在机器学习建模流程中,“特征重要性分析” 是连接 “数据” 与 “业务” 的关键桥梁 —— 它不仅能帮我们筛选冗余特征、提升模 ...
2025-10-11在企业的数据体系中,未经分类的数据如同 “杂乱无章的仓库”—— 用户行为日志、订单记录、商品信息混杂存储,CDA(Certified D ...
2025-10-11在 SQL Server 数据库操作中,“数据类型转换” 是高频需求 —— 无论是将字符串格式的日期转为datetime用于筛选,还是将数值转 ...
2025-10-10