京公网安备 11010802034615号
经营许可证编号:京B2-20210330
在寒冷的天气里 谈谈大数据如何提高天气预报的准确性
天气预报是大数据应用最早的领域之一, 古人们总结出的节气和天气谚语沿用了几个世纪。
如何预测天气
前650年左右巴比伦人使用云的样子来预测天气。中国人至少在前300年左右有进行天气预报的纪录。古时靠观察总结出天气现象和天气谚语来指导人们的生活,只是泛泛,却也足以。
17世纪开始科学家开始使用科学仪器(比如气压表)来测量天气状态,并使用这些数据来做天气预报。但很长时间里人们只能使用当地的气象数据来做天气预报,因为当时人们无法快速地将数据传递到远处。1837年电报被发明后人们才能够使用大面积的气象数据来做天气预报。
今天的天气预报主要是使用收集大量的数据(气温、湿度、风向和风速、气压等等),结合有关气象资料、地形和季节特点、经验等综合因素来研究确定未来的天气情况。由于大气过程的混乱以及今天科学并没有最终透彻地了解大气过程,因此天气预报总是有一定误差的。
目前,我国一般降水的预报准确率在80%左右,暴雨24小时预报的准确率大概是19%至20%,在相同算法下,美国的暴雨预报准确率是22%。
但是如果数据够多、建立的数学模型够精确,是可以接近自然的真实情况的。
气象数据量不断翻番
上世纪90年代及之前,中国气象资料大部分局限于地面及高空观测。当时,2000多个地面站以小时为单位收集气象信息;120多个高空站每天观测最多不超过4次。从数据量上看不算太多,即便考虑到卫星和雷达资料,其总体日增量也局限在GB量级。
现在,地面观测站大约有4万个,每10分钟观测一次,未来还将加密至分钟级;在空间密度上,至少增加20倍,频度将增加60倍,地面及高空观测信息总量增加了1200倍。
而这些只占整个气象数据的30%,雷达、卫星以及数值预报数据占到了70%。目前,气象部门需要永久保存的数据目前约有4PB~5PB,年增量约1PB。每年的气象数据已接近PB量级(1000GB=1TB,1000TB=1PB)。
这也正是大数据规律的体现,观测信息量越大,所蕴藏的真实信息越多,就更能做好预报。
气象服务盘活数据
海量气象数据怎么用?这是大数据时代亟待考虑的问题。就现有情况看,数据在气象预报、气候预测诊断方面运用得比较充分;而在气象服务领域,大量实况观测数据往往被搁置。
目前的实况数据气象服务主要基于单要素单一站点的形式。这意味着,人们收到的气象服务只是周边气象站点的天气情况,并且总有延迟。
为此,科研人员正在引进国际先进的空间数据融合数值模式方法,即将周边几个站点的数据以及其他传感器所获得的数据融合进模式中,反演出整个区域的天气情况。从试验结果看,运算速度达到分钟级,小区域可达到秒级。
“这些工作都是在大数据的基础上才能够进行,无论模式如何先进,没有海量的数据进入,都不能达到很好的效果。”中国气象局公共气象服务中心高级工程师唐千红说。
让科研人员欣喜的是,在大数据时代,数据并非单纯指人们在互联网上发布的信息。全世界的工业设备、汽车、电表上有着无数的数码传感器,随时测量和传递着有关位置、温度、湿度乃至空气中化学物质的变化。可以设想,这些信息都可以被气象部门所用。
EarthRisk是一家利用大数据对未来天气情况作出预报的技术公司,它采用的预测模型项源自加州大学斯克利普斯海洋研究所。
该模型不同于以往的数值预报模式,可基于 820 亿次计算以及 60 年的气象历史数据来识别天气模式,然后将这些模式与当前的气候条件进行比较,再运用预测性分析进行天气预测,其预测时间更长、预测准度更高,最长可提前 40 天生成冷热天气概率,而传统主观预测的模型一星期以上的准度就不行了。
大数据时代下的气象服务是什么样子?唐千红认为,在看得见的未来,融入了地理信息、社会经济数据的气象服务,能够让人们知道任意时间地点可能会发生什么,例如这阵风是否会吹翻门口的广告牌,前面一个高速路口是不是在下雨、会不会发生山洪。
天气预报的未来
毫无疑问,虽然现在吐槽再多,气象部门还是一直在努力完善工作的。建设更多的观测站,运用更加先进的计算设备、培养数据人才建立更完善的天气预报模型,同时也离不开经验丰富的预报人员,天气预报、乃至是灾难预报都能更加准确。
以后天气预报的趋势,是朝精细化,精准化发展。同时在这个过程中消耗的大量人力物力可以通过数据的共享和同其他行业的交叉应用来弥补,这方面,大数据的预测意义才越发显得重要。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在 MySQL 查询性能优化体系中,索引是降低查询耗时、提升数据库吞吐的核心手段。其中联合索引与覆盖索引是实际开发中最高频的两 ...
2026-06-15在数据仓库建设与商业智能分析体系中,维度建模是应用最广泛的建模方法论,而事实表与维度表是维度建模的两大核心构件,共同构成 ...
2026-06-15 很多数据分析师能熟练计算指标,但当被问到“这家企业的核心业务目标是什么”“如何把模糊的战略目标拆解为可量化的指标”“ ...
2026-06-15在数据分析、业务监控、运营复盘等场景中,列值趋势计算是核心需求之一。无论是分析销售额的月度增长、用户活跃的变化趋势、库存 ...
2026-06-12在数字经济深度渗透的当下,消费者的购买行为已从过去的 “被动接受” 转变为 “主动决策”。流量红利消退、获客成本攀升、用户 ...
2026-06-12CDA三级认证是三个级别中的塔尖,全面考察数据战略、团队领导和复杂项目的综合能力。它所对应的《敏捷数据挖掘》教材,不再局限 ...
2026-06-12在游戏产业的商业逻辑中,付费玩家是支撑游戏生存与发展的核心支柱。行业普遍遵循 “二八定律”:20% 的付费玩家贡献了游戏 80% ...
2026-06-11【核心关键词】企业、定位、传统、产品、互联网、可视化、业务侧、数字化、结构化、数据分析、传统制造业、市场状态、发展空间 ...
2026-06-11 解读《CDA二级教材:量化策略分析(2025)》的全景结构与学习逻辑 ” CDA二级认证是企业招聘数据分析师时最常提及的证书门槛 ...
2026-06-11【核心关键词】药企、可视化、营销、分类、数据分析师、销售数据、业务人员、指导方向、分析报告、营销数据、营销医生 【专访摘 ...
2026-06-10在统计学分析、问卷调研、实验验证、业务复盘等场景中,卡方检验与 T 检验是应用最广泛的两类基础假设检验方法。前者专门处理分 ...
2026-06-10 很多数据分析师每天都在计算指标、制作报表,但当被问到“什么叫指标数据元”“指标数据标准包含哪些核心维度”“指标数据质 ...
2026-06-10在MySQL数据库日常查询、数据统计、后台接口开发、数据导出等场景中,开发者经常需要查询数据表除某几列之外的所有字段。例如查 ...
2026-06-09在Python网络请求、爬虫开发、接口测试、数据抓取等实操场景中,requests库是最常用的第三方请求工具,而content属性是requests ...
2026-06-09 数据分析正在重塑每一个行业。CDA认证的三本官方教材,分别对应Level I、Level II、Level III,为你铺就从业务数据分析到数 ...
2026-06-09在数字财务、智慧财税、业财融合深度推进的当下,传统财务模式下数据标准混乱、业务流程碎片化、知识无法沉淀、系统互通性差等问 ...
2026-06-08随着数字经济深度渗透各行各业,数据正式成为继土地、劳动力、资本、技术之后的第五大生产要素,是企业数字化转型、精细化运营、 ...
2026-06-08 很多数据分析师能熟练写SQL、做透视表,但当被问到“数据是从哪里来的?经过哪些加工才进入数据仓库?ETL具体做了什么?”时 ...
2026-06-08【核心关键词】贷款、报表、课程、专业、建模、缺失值、营销、互联网、银行、办公自动化、数据分析、数据预处理、特征工程、贷 ...
2026-06-05在数据库数据查询、业务报表统计、多表关联分析中,LEFT JOIN左连接是使用率最高的SQL关联查询语句。其核心特性是保留左表全部数 ...
2026-06-05