京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据与人工相结合,谷歌地图够精准吗_数据分析师
12月9日消息,据国外媒体报道,我们使用的导航地图近十年已经发生了翻天覆地的变化。上世纪90年代,我们还在用纸质地图寻找目的地。而现在基本只需要服从Siri或她的谷歌竞争对手的导航指令。
“地面真相”算法和街景服务
不过这些导航指令背后隐藏着大多数人无法想象的众多数据。目前由于谷歌已经获得了极其庞大的地图数据,他们开始采用大数据方法,或谷歌称之为“地面真相”的算法和细致的人工努力相结合的方法,为用户提供更详尽的地图信息。该项目于2008年推出,但它一直处于保密状态,直到几年前才公开。它持续增长,现已覆盖51个国家。这一算法在提取卫星、空中和街景视图的信息时发挥了巨大的作用。
谷歌“地面真相”算法可以识别的街景信息
谷歌2007年推出了街景服务,通过让人们看到目的地周围的环境来提高用户体验。谷歌地图副总裁布莱恩·麦克伦登(Brian McClendon)。表示,“我们很快就意识到做地图的最佳途径之一,就是拥有全世界的街头照片。”
随着街景收集数据的增长,抽查他们的数据已经不是很好的解决方案。谷歌地图产品经理马尼克·古普塔(Manik Gupta)表示,现在街景车已经行驶700多万英里,覆盖美国99%的公共道路,“它实际上使我们能够利用算法建立提取信息之外的新数据层。”
这些算法借用计算机视觉和机器学习的方法来提取路边的街道编号、企业名称、限速交通标志等细节信息。 不过很多信息还是非常难以提取,麦克伦登表示,“停止标记常常很容易被忽略。转弯限制对于导航来说也很重要,但对于谷歌的捕捉算法还很难处理。因为这些标记箭头可能是被画在道路上,它们可以是不同的颜色和大小。车道标记的分析更难,因为他们并不一致。”
谷歌地图普通用户不可见的转弯限制信息。
路牌也是非常重要的信息。驾驶者听到的导航指示如果能匹配他们看到的,那么他们就能更好的被指引。但有时街道标志使用的拼写或缩写导致了很多麻烦。“匹配标志上的文字实际上是一个很困难的任务。”
另外,谷歌的算法还可以利用卫星和航空影像提取建筑物的轮廓和高度。美国大多数的建筑物现在都可以在谷歌地图上找到。对于像西雅图太空针塔这样的标志性建筑,计算机视觉技术已经可以提取出详细的3D模型。谷歌曾表示,它收购高分辨率卫星图像公司Skybox就是为了提高其地图的准确性。
计算机视觉技术提取的标志性建筑物3D模型
职业地图纠错团队和MapMaker计划
然而,卫星和算法的能力还是有限。为了提供最好的体验,谷歌雇佣了一只由人类组成的团队,手动检查并使用内部程序Atlas纠正地图的错误。谷歌公司以外很少有人见过这一应用。
这一人工检查团队看到的地图类似于谷歌地图的卫星地图混合视图,但带有没见过的彩色线条和符号。例如,道路根据行进方向进行了颜色编码。绿色和红色箭头指示了给定的交叉路口的可能前进方向。工作人员可以点击屏幕一侧的按钮,拖曳、切换或关闭各种层,控制街景视图拍摄的交通标志的出现和消失。这些工作人员每天要检查数以千计来自谷歌地图用户的错误报告,并根据需要进行修复。
工作人员可以手动将地图道路(左上)对准卫星图像
古普塔还展示了一张显示道路优先级的地图,线的宽度代表交通流量。谷歌一直用手机的位置信号映射交通条件。不过古普塔承认,位置信号也可以是其他信息的良好来源,比如转弯限制或者单行线。但他拒绝详细说明,“谷歌在很多地方使用了位置信息,但我不能谈论具体的东西。”
除了职业地图纠错团队,谷歌还得到来自MapMaker计划的帮助。2011年谷歌推出了普通用户可以参与的地图纠错项目,现在的该项目遍及220个国家。目标是提高谷歌地图在发展中国家和其他地区的准确度。因为在那里无法获得详细的地图源,“我们招募用户添加对于他们很重要的地图信息。我们会提供工具和卫星图像,因此他们可以很轻松的进行修正。”
用户可以提供公园、步道以及其他街景车无法进入的地方的信息。麦克伦登本人就曾帮助绘制Windy山的登山路径,“我用GPS记录了我登山的路径,完善了更多的精确路线。”
当你在笔记本电脑或手机上使用谷歌地图时,表面的信息之下隐藏着更多的数据。不只是道路的布局,还包括链接一个点到另一个点的逻辑信息。信息不只是建筑物的形状,也许未来谷歌地图只会不断的细节化。最终,呈现出来的可能是让人震惊的世界3D虚拟图像。
道路标志可利用算法从街景中提取,从而提供交通信息
(秉翰)
相关阅读:
新版谷歌地图将深度集成Uber和OpenTable
5月谷歌地图集成了一些Uber应用功能,如“叫Uber车”和查看估计的坐车时间。现在,谷歌地图将能显示估计的上车时间和路线价格。如果你准备去餐馆,使用新的谷歌地图可通过OpenTable预定(只限美国)。
Google Maps变得更加色彩化,推出iOS和Andriod版
继Google推出全新设计的日历app之后,又推出全新设计的Google地图,Google地图的设计更加色彩画,时尚的风格更具有视觉效果视觉效果。Google Maps展示了iPhone、Android手机与平板电脑上的版本,但没有提到iPad上是否能使用。
相关话题:
公交导航,能否占据地图数据产业下一个"竿位"
公交导航发布,标志着互联网地图应用已经从普及进入实时导航阶段。地图数据后续的发展方向之一,能为公共交通出行提供全程流畅的提醒和导航的,就是公交导航了。
地图应用推O2O商业化,时机并不成熟
之所以会有“地图产品上该不该力推商业化O2O”的疑问,从产品角度看,可以转化为“用户对于地图产品的期望是不是生活服务消费”?从几个维度的数据来看,这种设想中的行为模式还没成气候。
那些年,曾经被我们误读的大数据
业界和学术界一直在热议大数据,不管是学术圈还是IT圈,只要能谈论点儿大数据就显得很高大上。然而,大数据挖掘、大数据分析、大数据营销等等事情仅仅只是个开始当然,也有很多人直接批判大数据或大数据营销给我们造成的隐私威胁,大数据到底是什么?它又有着哪些价值呢?
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数据工作的全流程中,数据清洗是最基础、最耗时,同时也是最关键的核心环节,无论后续是做常规数据分析、可视化报表,还是开展 ...
2026-03-20在大数据与数据驱动决策的当下,“数据分析”与“数据挖掘”是高频出现的两个核心概念,也是很多职场人、入门学习者容易混淆的术 ...
2026-03-20在CDA(Certified Data Analyst)数据分析师的全流程工作闭环中,统计制图是连接严谨统计分析与高效业务沟通的关键纽带,更是CDA ...
2026-03-20在MySQL数据库优化中,分区表是处理海量数据的核心手段——通过将大表按分区键(如时间、地域、ID范围)分割为多个独立的小分区 ...
2026-03-19在商业智能与数据可视化领域,同比、环比增长率是分析数据变化趋势的核心指标——同比(YoY)聚焦“长期趋势”,通过当前周期与 ...
2026-03-19在数据分析与建模领域,流传着一句行业共识:“数据决定上限,特征决定下限”。对CDA(Certified Data Analyst)数据分析师而言 ...
2026-03-19机器学习算法工程的核心价值,在于将理论算法转化为可落地、可复用、高可靠的工程化解决方案,解决实际业务中的痛点问题。不同于 ...
2026-03-18在动态系统状态估计与目标跟踪领域,高精度、高鲁棒性的状态感知是机器人导航、自动驾驶、工业控制、目标检测等场景的核心需求。 ...
2026-03-18“垃圾数据进,垃圾结果出”,这是数据分析领域的黄金法则,更是CDA(Certified Data Analyst)数据分析师日常工作中时刻恪守的 ...
2026-03-18在机器学习建模中,决策树模型因其结构直观、易于理解、无需复杂数据预处理等优势,成为分类与回归任务的首选工具之一。而变量重 ...
2026-03-17在数据分析中,卡方检验是一类基于卡方分布的假设检验方法,核心用于分析分类变量之间的关联关系或实际观测分布与理论期望分布的 ...
2026-03-17在数字化转型的浪潮中,企业积累的数据日益庞大且分散——用户数据散落在注册系统、APP日志、客服记录中,订单数据分散在交易平 ...
2026-03-17在数字化时代,数据分析已成为企业决策、业务优化、增长突破的核心支撑,从数据仓库搭建(如维度表与事实表的设计)、数据采集清 ...
2026-03-16在数据仓库建设、数据分析(尤其是用户行为分析、业务指标分析)的实践中,维度表与事实表是两大核心组件,二者相互依存、缺一不 ...
2026-03-16数据是CDA(Certified Data Analyst)数据分析师开展一切工作的核心载体,而数据读取作为数据生命周期的关键环节,是连接原始数 ...
2026-03-16在用户行为分析实践中,很多从业者会陷入一个核心误区:过度关注“当前数据的分析结果”,却忽视了结果的“泛化能力”——即分析 ...
2026-03-13在数字经济时代,用户的每一次点击、浏览、停留、转化,都在传递着真实的需求信号。用户行为分析,本质上是通过收集、整理、挖掘 ...
2026-03-13在金融、零售、互联网等数据密集型行业,量化策略已成为企业挖掘商业价值、提升决策效率、控制经营风险的核心工具。而CDA(Certi ...
2026-03-13在机器学习建模体系中,随机森林作为集成学习的经典算法,凭借高精度、抗过拟合、适配多场景、可解释性强的核心优势,成为分类、 ...
2026-03-12在机器学习建模过程中,“哪些特征对预测结果影响最大?”“如何筛选核心特征、剔除冗余信息?”是从业者最常面临的核心问题。随 ...
2026-03-12