三亚市网站建设_网站建设公司_跨域_seo优化
2026/1/5 20:52:58 网站建设 项目流程

天气预报的精准度和预见期,直接影响灾害防御、农业生产和全球资源调度。从短时预警到季节乃至更长期的气候预测,每延长一步,技术挑战都成倍增加。传统数值预报发展多年后,AI 为这一领域带来了新动力。近年来,AI 天气预报模型已在中期预报上取得突破,其性能媲美甚至超越了先进的传统动力模式。

目前主流 AI 气象模型多采用自回归架构,其原理是逐步推演,通过学习历史数据中的短期大气变化规律,预测未来几小时的状态。这种模型在中期预报中表现出色,但在向次季节至季节(S2S)等长期尺度拓展时,遇到了根本性瓶颈。

长期预报需依赖概率方法,而自回归模型只能通过反复迭代进行多步预测,导致误差不断累积,且难以校准。其核心矛盾在于:训练目标是学习短期规律,而长期预报需要构建能够刻画气候慢变率的概率模型。

为突破此局限,研究者开始探索单步长预测新路径。但新问题随之而来:基于现有再分析数据训练长期单步模型时,会因数据样本稀少而严重过拟合,模型可靠性无法保证。

在此背景下,英伟达研究院联合华盛顿大学的研究团队推出了一种长距离蒸馏(Long-Range Distillation)新方法,其核心思路是利用擅长生成真实大气变率的自回归模型作为「教师」,通过其低成本、快速模拟产生海量合成气象数据;再用这些数据训练一个概率化的「学生」模型。学生模型仅需单步计算即可生成长期预报,既避免了迭代误差累积,也绕过了复杂的数据校准难题。

这一方法脱离自回归建模框架,转而将大规模气候数据压缩为条件生成模型,突破了以往训练数据有限的制约。研究中采用能稳定模拟百年气候的自回归耦合模型作为教师,生成了规模远超真实记录的训练样本。初步实验表明,基于此训练出的学生模型,在 S2S 预报上与 ECMWF 集成预报系统相当,且其性能随合成数据量增加而持续提升,有望在未来实现更可靠、更经济的气候尺度预测。

相关研究成果以「Long-Range Distillation: Distilling 10,000 Years of Simulated Climate into Long Timestep AI Weather Models」为题,已发表于 arXiv。

研究亮点:

  • 突破真实观测数据时长限制,利用 AI 气象模型生成超万年合成气候数据,使模型能够学习实际观测中未曾充分呈现的慢变气候模态;

  • 提出长距离蒸馏方法,仅需单步计算即可输出长期概率预报的模型,克服了传统自回归框架中数百步迭代导致的误差累积与不稳定问题;

  • 经真实世界数据适配后,模型在次季节至季节预报上的技巧,已达到欧洲中期天气预报中心业务系统的相当水平。

数据集:合成气候数据的生成、划分与评估框架

在评估长距离蒸馏模型的跨时效集成预报能力时,该研究首先在受控的理想模型实验中进行验证。所有评估数据均取自自回归教师模型 DLESyM(Deep Learning Earth System Model)预留的模拟数据,且在蒸馏模型的训练过程中从未被使用。这一设置的核心目的,是检验在初始条件未完全确定的情况下,蒸馏长步长模型与 DLESyM 教师模型对未见模拟天气的预报表现,确保评估的客观性。

评估不仅采用了集成均方根误差(RMSE)等确定性指标,还引入了连续排序概率评分(CRPS)这一概率预报评估工具,以更全面地衡量预报性能。研究人员选取了 3 个具有不同可预测性机制的预报时效进行测试:

  • 中期时效:

针对 7 天的日平均预报(参数 N=28, M=4),使用 2017 年 1 月 1 日至 2019 年 3 月 10 日(模拟年)的预留数据,每 2 天选取一个初始日期,共 400 余个样本。

  • S2S 时效:

针对 4 周的周平均预报(参数 N=112, M=28),使用 2017 年 1 月 1 日至 2021 年 5 月 16 日(模拟年)的数据,每 4 天一个初始日期,样本量同样超过 400 个。

  • 季节时效:

针对 12 周的月平均预报(参数 N=336, M=112),使用 2017 年 1 月 1 日至 2025 年 9 月 28 日(模拟年)的数据,每 8 天选取初始日期,样本数约 400 个。

为确保独立性,研究人员将由 DLESyM 生成的总计约 15,000 年合成气候模拟数据,按集合成员维度划分为训练集(75%,约 11,000 年)和验证集(25%),并为每个预报时效训练了独立的蒸馏模型。这些合成数据的生成采用了并行化策略:在 2008 年 1 月 1 日至 2016 年 12 月 31 日期间均匀选取 200 个初始日期,每个日期对应进行 90 年模拟,从而获得总时长 18,000 年的气候数据。

该研究的最终目标是将训练好的模型应用于真实世界长期预报。需要注意的是,DLESyM 长期运行形成的「模型气候」与真实气候存在差异。因此,将模型迁移至真实应用时,需重点解决这一「域转移」问题。

长距离蒸馏:「数据蒸馏」与「概率校准」的双重创新

长距离蒸馏方法的创新思路在于,它利用一个能够稳定长期运行的短步长自回归模型作为「教师」,来训练一个仅需单步计算即可输出长期预报的「学生」模型。这从根本上避免了传统自回归框架中数百步迭代所带来的误差累积问题。

具体而言,研究人员从教师模型的长期滚动序列中定义长期预报目标,即未来某一时间窗口内状态的平均值。学生模型则直接学习从初始状态到该长期目标的条件概率分布。教师模型的核心价值在于其高效生成海量合成数据的能力,这些数据的规模远超原始再分析数据,从而解决了长期预报训练样本稀缺的难题。

*长距离蒸馏示意图*

为实现这一目标,该研究采用 DLESyM 模型作为「教师」。该模型基于 ERA5 再分析数据初始化,预报关键变量如海温、气温和位势高度等。研究人员设计了高效的数据生成策略:从 2008 至 2016 年间均匀选取 200 个初始日期,并行开展为期 90 年的模拟,总计得到 18,000 年的合成气候数据。在强大算力支持下,数据生成过程仅耗时数小时,充分体现了 AI 气候模拟的效率优势。经过质量筛选,约 15,000 年的有效数据被用于后续模型的训练与验证。

「学生」模型采用条件扩散模型架构,专门为概率预报而设计。其目标是建模未来长期天气状态与输入条件(如前 4 天的日平均状态)之间的复杂关系。模型架构基于一个适配于 HEALPix 网格的 UNet 网络改进而成,通过引入可学习的空间嵌入和周期性的时间嵌入,以有效捕捉全球天气场的时空依赖特性。在训练中,研究人员采用特定的噪声调度策略,以确保模型能学习到数据中所有尺度的特征。

为精确校准概率预报的不确定性,本研究创新性地引入了「无分类器引导(Classifier-Free Guidance)」,允许在模型推理阶段通过调节一个简单的权重参数,灵活控制预报集合的离散度,使其与预报误差达到最佳平衡,从而便捷地生成校准良好的概率预报。

为使模型能够胜任真实世界的预报任务,该研究针对「域转移(domain shift)」问题实施了双重策略。一是进行气候偏差订正,修正模拟数据与真实观测在平均态上的系统性差异;二是利用有限的 ERA5 再分析数据对模型进行微调,仅更新网络中的部分关键参数,使模型在保留从海量合成数据中学到规律的同时,更好地适应真实大气的特征。最终,通过与欧洲中期天气预报中心(ECMWF)等顶尖业务系统的对比,评估了模型在真实场景中的竞争力。

多维度突破,数据可扩展、预报可校准、技能可比肩顶尖业务系统

通过系列实验,该研究围绕训练数据规模的影响、预报不确定性的校准、多时效预报技能,以及与业务系统的对标四个方向,系统地验证了长距离蒸馏模型的性能与潜力。

首先,该研究验证了核心假设——增加合成训练数据量能显著提升模型预报能力。如下图所示,该研究使用仅 40 年模拟数据训练的模型很快出现过拟合,而基于约 1.1 万年合成数据训练的模型(简称 DLESyM10K)则表现出稳定的学习曲线。更重要的是,数据量的增长直接转化为预报技能的提升:在 4 周气温预报中,CRPS 评分降低了 14%。这首次证明,利用自回归模型生成大规模合成数据,可有效构建更强大的长期预报模型。

*基于训练数据集的学生模型 S2S 预测技能缩放*

研究采用「无分类器引导」技术来校准概率预报的离散度。通过调节引导强度,可以控制预报集合的分散程度,使其与预报误差达到最佳平衡。实验表明,引导强度设为 1 时,模型即可自动实现良好的校准;若需调整,也只需在推理阶段简单调节该参数。这为概率预报提供了一种高效、灵活的校准手段。

*使用无分类器指导的中期蒸馏学生模型的预测校准*

模型在中期、次季节至季节(S2S)和季节预报中均表现出稳健性能。在中期预报中,模型对初始误差表现出较强的鲁棒性,其概率建模特性有助于对冲初始条件的不确定性。在更具挑战的 S2S 和季节预报中,DLESyM10K 的技能显著优于气候学基准,尤其在热带和海洋等可预测性较高的区域表现突出。值得注意的是,它通过单步计算就达到了与自回归教师模型数百步迭代相当的技能,体现了该框架的高效性。

*真实场景下的中期预报技能*

将模型迁移至真实世界预报时,通过微调和偏差校正解决了「模型气候」与真实气候的差异问题。与欧洲中期天气预报中心(ECMWF)业务系统的对比显示:经过微调的 DLESyM10K,其 4 周气温预报技能与 ECMWF 系统非常接近,且两者均显著优于气候学基准。区域分析表明,两者在不同地理区域各有优势,例如 DLESyM10K 在美洲和非洲中部部分区域表现更好。这证明了该 AI 模型具备与先进业务系统竞争的潜力,同时凸显了其差异化价值。

*在完美模型实验中提炼学生模型远期预测技巧*

综上所述,长距离蒸馏方法通过「数据缩放」与「单步概率建模」的结合,训练出能单步输出长期概率预报的条件扩散模型,并结合无分类器引导技术实现了灵活的不确定性校准。实验表明,该方法在次季节至季节预报中已达到与欧洲中期天气预报中心业务系统相当的性能。这一范式不仅为长期天气预报提供了新方案,也为构建服务于气候科学探索的通用生成模型奠定了基础。

全球产学研协同加速气象技术变革

以 AI 生成合成数据解决长期预报中的数据瓶颈,正成为学术界与工业界共同推动气象预报革新的重要方向。一系列前沿研究与工程实践接连涌现,持续推动长期天气预报从理论探索走向业务应用。

在学术界,跨学科协作正成为攻克核心技术难题的关键。例如,芝加哥大学发起的「AI 气候计划(AICE)」,联合了气候科学、计算机与统计学等多领域专家,致力于大幅降低气候预报的计算成本。其研发的技术已实现使用普通笔记本电脑生成高水平预报,有望帮助缩小不同地区在气象预报能力上的差距。

剑桥大学联合图灵研究所、欧洲中期天气预报中心等机构,共同开发了端到端数据驱动预报系统 Aardvark Weather。该系统能够融合多种观测数据,同步输出全球网格预报与局部站点预报,在 10 天预报时效上已展现出可与优化后的业务数值模式相媲美的性能。其端到端的建模理念,与长距离蒸馏简化预报流程的初衷高度一致,为长期预报的精准化提供了技术范本。

  • 点击查看 Aardvark Weather 深度解读:登Nature,剑桥大学等发布首个端到端的数据驱动天气预报系统,预测速度提升数十倍

  • 论文名称:End-to-end>

需要专业的网站建设服务?

联系我们获取免费的网站建设咨询和方案报价,让我们帮助您实现业务目标

立即咨询