京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据时代 看天更靠谱
大数据时代,气象服务在不断地拓宽领域,从最基础的天气预报到现有的气候预测、气候可行性论证、公共气象服务、专业专项气象服务、气象防灾减灾,为社会创造财富、减轻损失;同时,大数据技术是气象服务不断创新和完善的重要支撑。
1 事实验证数据分析,“妮坦”的红色预警发对了
每个城市都有各行各业的大数据,深圳市在推进大数据发展方面已经具备一定基础,共享基础数据库建设等方面处于国内领先水平,在市场监管、交通运输、税务部门等部门的应用取得了积极成效。
在气象大数据方面,深圳市气象局与深圳先进院已合作多年。2009年,深圳市气象局与先进院高性能计算中心开始交流合作,2012年初,深圳市气象局提出预报“回南天”的研究方向,随后又提出台风精准预报、灰霾预报等新课题。
5年前,先后在加拿大麦吉尔大学、香港大学学习的李晴岚加入深圳先进院,被委派至深圳市气象局担任相关项目负责人。通过与深圳市气象局等部门合作,深圳先进院气象预报团队在台风风雨预报领域取得了显著的成果,大幅度提高了台风预报的时间、空间精度。基于这些数据,气象部门能够做出及时准确的预报预警,政府部门能够有效地组织人员疏散,最大限度地保障人民生命和财产安全。
以8月的“妮妲”为例,根据深圳先进院与市气象局合作的“近海台风引发深圳地区的风雨研究”的结论,“妮坦”台风从东南方向接近珠三角地区,距离深圳200公里左右时将引发深圳大风,全市大风起风时间在22时至24时左右,并推测深圳最大阵风将达到12-13级。
李晴岚告诉记者:“根据大数据分析结果,严格来说盐田港的最大阵风应该在27-33米/秒范围。盐田港风力一般受台风影响大,但在深圳市不一定是最大的,为安全起见,考虑深圳可能的最大阵风报12到13级比较合适,与实际观测值深圳地区在‘妮妲’影响期间的最大阵风为37米/秒高度吻合(13级风的范围在37-41.4米/秒之间)”。
市气象局依据此科研结果,综合气象预报员的专业分析,在第一时间果断对市民发出了台风红色预警,这也是深圳市气象台历史上首次发布台风红色预警。
“每一次台风到来,产生的新观测数据都会纳入数据库。”李晴岚表示,对每一种进入700公里影响范围的不同类型台风,如果数据库只有2个样本供参考,预报正确的概率是33%,如果历史上有18个类似样本供参考,预报正确的概率可以大幅提升到89%。随着样本数的增加,预报置信度就会越高。
2 从“韦森特”到“海鸥”,准确预测降水、风力
李晴岚表示,相比较为容易预测的台风路径,台风强度预报和台风风雨定量预报是世界性的预测难题。
2011年,刚从香港来深圳不久的李晴岚了解到市气象局一直在做风雨定量预报方面的研究,但一直困难重重未能出结果。大约半年后,她和团队部分解决了这个难题。
2012年7月24日,台风“韦森特”在深圳登陆,最大日降水量达到152.5毫米。在“韦森特”登陆前,李晴岚已经有了初步的研究结果,认为“韦森特”带来的日最大降水量有50%的可能性在109-191毫米之间,而降水量在100-250毫米之内被定级为大暴雨。实际观测值与预测值均为大暴雨,“韦森特”验证了李晴岚关于台风引发深圳地区降水定量预报的研究。
长期未能解决的难题为何有了转机?“最关键的是‘分类’,按照类别预估台风带来的影响。”李晴岚说,她根据台风登陆时的登陆地点、登陆距离、台风强度、登陆方位等关键特性进行划分,通过统计分析和数据挖掘的方法得出台风雨的影响程度。这是她乘坐公交车下班途中得到的灵感,经过几次与气象局专业人士的讨论尝试,半年内便有了初步的结果。
李晴岚先后在加拿大麦吉尔大学、香港大学取得了环境工程学硕士、博士学位。她从硕士开始就做数据分析、数学建模,在读博士期间研究过动力,对既注重动力也注重统计的气象研究有一定的帮助。
相比台风带来的降水预报,有关风的预报更为复杂。2014年4月,在此前一项研究的启发下,李晴岚开始着手台风对深圳地区大风影响的研究,半年内便有了初步的结果,当年9月“海鸥”登陆验证了她的研究。
“‘海鸥’中心距盐田港气象自动站的最近距离约有400公里,据以往经验,气象局认为此次台风影响不会很大,但预报员并不确定到底会引起多大的风。”按照李晴岚的预测,风力最大会达到27米/秒,时间在凌晨0时到2时之间,这与实际观测值29.1米/秒非常接近,最大风力发生时间为凌晨1时14分。
李晴岚的同事感叹道:“第二天上午气象局会商,大家都沸腾了,之前传统的气象手段还无法把距离在400公里左右的台风引起大风的时间及其强度预算得这么准。”
3 为盐田港作精细化预报,根据应用需求定课题
最近,李晴岚撰写的关于台风风雨定量预报的一篇研究论文将登上美国气象学会下的《Weather and Forecasting》杂志,这是气象预报领域的顶级期刊。
“我每周有三天都在深圳气市象局工作,与工作在一线的预报员天气会商,参加周报会,技术交流会,了解天气预报中的要点、难点;两天在深圳先进院,与同事沟通讨论、指导学生科研学习。”李晴岚告诉记者,比起理论研究,自己的研究工作更注重应用,一般是研究结果能直接应用于业务之后,才再撰写论文。
深圳盐田港是国际集装箱码头,风力条件对其码头日常货柜储运业务影响非常大,气象预报与经济利益的关联大。应对台风时如果停工过早,将造成较大损失,如果预警不及时,又可能有事故发生,因此精准的预报尤为必要。针对这种需求,李晴岚展开了重点防护单位定点精细化预报研究。
据盐田国际集装箱码头有限公司反馈给深圳先进院的信息,得益于深圳先进院研发的“近海台风引发区域性风雨预报”的技术模块——它能提前1-2天进行精细化的台风风雨影响预估,争取到更多灾害防御时间。空间精细到港区,可预估盐田港区域受台风影响的风雨特点、程度、持续时间。该模块启用后,3年来未出现因台风造成的港区人员伤亡,对盐田港业务经营和管理发挥了重要作用。
李晴岚说,气象部门掌握着丰富的第一手观测资料,他们急需把这些资料利用起来为气象预报服务。深圳先进院有着深厚的科研实力,也希望能发挥科研优势,与实际问题结合,为国计民生服务,因而才有了深圳先进院与深圳气象局的强强联合、深入合作。
据悉,深圳市气象局还通过深圳先进院与欧洲中期天气预报中心、美国俄克拉荷马大学风暴分析预报中心保持良好的合作。
记者了解到,李晴岚课题组将与深圳市气象局一起联合申报多模式集成预报系统项目,这个创意就产生自国际合作的过程中。多模式集成是指融合欧洲中心模式、日本模式、中国气象局Grapes模式,以及深圳气象局自主研发的实时同化预报系统模式的特点,发挥各自的长处,得出深圳乃至华南地区更精准的天气预报。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数据处理的全流程中,数据呈现与数据分析是两个紧密关联却截然不同的核心环节。无论是科研数据整理、企业业务复盘,还是日常数 ...
2026-03-06在数据分析、数据预处理场景中,dat文件是一种常见的二进制或文本格式数据文件,广泛应用于科研数据、工程数据、传感器数据等领 ...
2026-03-06在数据驱动决策的时代,CDA(Certified Data Analyst)数据分析师的核心价值,早已超越单纯的数据清洗与统计分析,而是通过数据 ...
2026-03-06在教学管理、培训数据统计、课程体系搭建等场景中,经常需要对课时数据进行排序并实现累加计算——比如,按课程章节排序,累加各 ...
2026-03-05在数据分析场景中,环比是衡量数据短期波动的核心指标——它通过对比“当前周期与上一个相邻周期”的数据,直观反映指标的月度、 ...
2026-03-05数据治理是数字化时代企业实现数据价值最大化的核心前提,而CDA(Certified Data Analyst)数据分析师作为数据全生命周期的核心 ...
2026-03-05在实验检测、质量控制、科研验证等场景中,“方法验证”是确保检测/分析结果可靠、可复用的核心环节——无论是新开发的检测方法 ...
2026-03-04在数据分析、科研实验、办公统计等场景中,我们常常需要对比两组数据的整体差异——比如两种营销策略的销售额差异、两种实验方案 ...
2026-03-04在数字化转型进入深水区的今天,企业对数据的依赖程度日益加深,而数据治理体系则是企业实现数据规范化、高质量化、价值化的核心 ...
2026-03-04在深度学习,尤其是卷积神经网络(CNN)的实操中,转置卷积(Transposed Convolution)是一个高频应用的操作——它核心用于实现 ...
2026-03-03在日常办公、数据分析、金融理财、科研统计等场景中,我们经常需要计算“平均值”来概括一组数据的整体水平——比如计算月度平均 ...
2026-03-03在数字化转型的浪潮中,数据已成为企业最核心的战略资产,而数据治理则是激活这份资产价值的前提——没有规范、高质量的数据治理 ...
2026-03-03在Excel办公中,数据透视表是汇总、分析繁杂数据的核心工具,我们常常通过它快速得到销售额汇总、人员统计、业绩分析等关键结果 ...
2026-03-02在日常办公和数据分析中,我们常常需要探究两个或多个数据之间的关联关系——比如销售额与广告投入是否正相关、员工出勤率与绩效 ...
2026-03-02在数字化运营中,时间序列数据是CDA(Certified Data Analyst)数据分析师最常接触的数据类型之一——每日的营收、每小时的用户 ...
2026-03-02在日常办公中,数据透视表是Excel、WPS等表格工具中最常用的数据分析利器——它能快速汇总繁杂数据、挖掘数据关联、生成直观报表 ...
2026-02-28有限元法(Finite Element Method, FEM)作为工程数值模拟的核心工具,已广泛应用于机械制造、航空航天、土木工程、生物医学等多 ...
2026-02-28在数字化时代,“以用户为中心”已成为企业运营的核心逻辑,而用户画像则是企业读懂用户、精准服务用户的关键载体。CDA(Certifi ...
2026-02-28在Python面向对象编程(OOP)中,类方法是构建模块化、可复用代码的核心载体,也是实现封装、继承、多态特性的关键工具。无论是 ...
2026-02-27在MySQL数据库优化中,索引是提升查询效率的核心手段—— 面对千万级、亿级数据量,合理创建索引能将查询时间从秒级压缩到毫秒级 ...
2026-02-27