济南市网站建设_网站建设公司_JSON_seo优化
2026/1/22 17:20:06 网站建设 项目流程

本文节选自25-26学年复旦大学大气与海洋科学系本科课程*《大数据分析与可视化》**期末研究报告,作者为堡状云(李昀泽),原标题为“*从天气到气候:基于盘古天气大模型的长期积分行为研究”。

近几年来,基于人工智能(Artificial Intelligence, AI)的气象大模型呈现井喷式地发展,人工智能大模型在天气预报领域取得了突飞猛进的进展。气象大模型在10-15天的中期天气预报上已达到甚至超过传统数值天气预报的表现。这些模型往往预报10-15天后停止,但作者有一个大胆的假设:

如果我们不停止它的运行, 延申到超长期的次季节、气候尺度呢?

背景

研究以盘古天气大模型为例,设计了“非物理初始场吸引子恢复试验”和“历史年代长期自由积分试验”两个实验。

盘古模型的输入不包含时间信息与海洋等变量,这使得该模型在长期积分中只能依赖其统计动力结构去“推演”季节循环或气候分布。更重要的是,当前所有主流AI天气模型基本均以1979年以后ERA5数据作为主要训练样本,因此它们所学习的气候分布势必带有现代气候的统计特征。如果以1950年的大气分析场作为积分初始条件,一个关键问题随之出现:**这些模型是否能够维持历史时期较冷、较不同的气候背景,或者会迅速回到1979–2020年间变暖的现代气候态、表现出一种“吸引子效应”?**这种行为不仅关系到AI模型是否具有气候模拟潜力,也影响其在极端天气、年代际预测甚至地球系统外推中的可信度。

盘古天气大模型结构示意,Bi, K., et al., 2023

根据前人研究,盘古模式可能没有类似数值模式中解对初值极端敏感性的“蝴蝶效应”现象,难以发展扰动(Selz, Craig, 2023)。Pu等(2025)构建的扰动动力学试验表明, 当初始深层风速误差达到1.5m/s阈值时, 其72小时增长幅度与物理模型一致. 基于此发展的集合扰动生成方案, 使热带气旋路径预报技巧显著提高。Li等(2025)的热带气旋路径预报目标观测研究进一步验证: 最快增长CNOP扰动在72小时预报期内呈现显著增长, 从而使得在CNOP确定的敏感区内同化额外资料, 可使台风路径预报误差减少约55%。

盘古模型在72小时后误差增长较数值模式比数值模型ICON低5个量级(Selz, Craig, 2023)

所以,尽管这个问题很“自由而无用” ,但是研究这个问题并不是毫无意义的,它可以帮我们回答三个问题:

1.模型是否会漂移到非物理守恒状态?

2.模型是否还存在周期性循环?

3.模型是否会收敛到一个类似真实大气的“统计吸引子,无论给什么条件都会迅速回到训练时间1979–2020年的气候态?

01

实验一:非物理初始场吸引子实验

为检验模型是否存在强制性的统计吸引子,本研究需要构造一个极端扰动的初始大气状态,作者选取了自家猫咪的图片直接构建,将其RGB灰度映射到±1000之间的数值输入。

图像转换至初始输入过程示意

结果显示,约一周后(图c),温度场和风场中原有的图像轮廓仅存少量痕迹,一个月后(图d、e),全球整体形态已接近典型的大气统计结构,300天后(图f),全球大气基本回到正常水平。

该实验结果表明,盘古天气模型在缺乏物理一致性约束的情况下,仍然内嵌了一个强制性的统计吸引子,由模型在训练阶段所学习到的气候统计特征所主导。我们据此猜测,它可能倾向于回归到训练时代的气候态,而非保持输入状态所代表的气候态。

图a-f:非物理初始场输入下盘古模式2m温度与10m风场

图g:盘古模式预报全球平均2m温度与10m风大小、平均海平面气压大小时间序列

在长期的预报中,已经能够出现多台风共舞这样平常的大气极端事件。也就是说过了一年,猫猫变成了太平洋上的台风。

非物理初始场输入下+7866h(约327日后)盘古模式预报中出现的多台风共舞现象

02

实验二:历史长期积分的气候态比较

为检验模型是否能够区分不同气候年代,本研究从ERA5中选取2个代表性年代的初始条件**:1950年1月1日、1990年7月1日**的分析场,并令模型进行15年的自由积分。所得结果将与ERA5从1950-2020年的参考气候对比,用于检验模型是否保留对历史气候差异的记忆,或是否迅速收敛到训练时代的气候态。

图a-c:盘古模式1950年1月1日起报2m温度、10m风场、海平面气压与ERA5再分析实况60S~60N纬度范围内平均对比 图d-f:同图a-c,1990年7月1日起报

结果显示,在不同初始状态下,盘古模式的长时间自由积分结果差异明显。整体上,盘古在积分初期经历快速系统调整,但却并未趋于同一气候态。(上图)

在1990-07-01起报试验中,T2m迅速偏离ERA5的季节循环,降至较ERA5持续偏冷5℃以上,之后维持在低值平稳状态;MSLP平均值也在初期快速跃升,随后保持系统性偏大,其振荡幅度与ERA5相近,表明模式在无外源约束时会趋向自身的内部平衡态,但该平衡态随初始状态不同而变化。

而在1950-01-01起报试验中,T2m的季节循环信号弱、振荡幅度小且周期不规则,但均值与ERA5接近;气压则长期偏高,振荡幅度大于ERA5。此外,该试验在1959–1960年前后出现温度骤降又回升的现象,并伴有风速和气压的峰值,说明系统尚未完全收敛。

(需要说明的是,两组试验中10m风速均持续显著高于ERA5,这主要源于双方在网格点平均与时间平均处理方式上的差异,因此该变量仅反映变化趋势,数值量级存在不确定性。)

盘古模式1990年7月1日起报的2m温度、10m风场、500hPa层面位势高度演变(0–4 d、30–59 d、90–179 d、365–729 d、1000–1299 d、3000–3299 d)

对明显偏冷的1990-07-01起报试验进行细致观察(上图),这一环流场在物理一致上仍可能有其合理性,但在地球整体上已经明显失去了应有的平衡。在它的构想中,南北半球可能同时进入了冬天。

为了更好地检查1990开始的这次预报的物理一致性问题,我们进行了500hPa高空地转偏差风检验。从这个来看,盘古在多年尺度上依然维持了与 ERA5 同量级的近地转平衡,年际起伏也颇为同步,说明它在“大尺度动力外观”上并未完全失真。(不过,梯度计算方法上存在不成熟的部分,当前的地转检验更适合被解读为“趋势性证据”)

上:盘古1990年7月1日起报预报对比ERA5全球平均地转偏差风大小时间序列

(范围:1990年7月1日-2005年6月31日)

下:盘古1990年7月1日起报预报,前六个半年对比ERA5全球平均地转偏差风分布,部分点状区域是通过显著性检验的区域(范围:1991年1月1日-1993年7月1日)

但另一方面,当目光转向全球热能量、水汽质量和动能等守恒量时,问题就暴露出来了。我们对3个物理量进行了守恒检验(下图),这些关键物理量在长期积分中出现了持续而显著的漂移,趋势超出了 ERA5 的不确定范围。在超长期积分中,盘古模型在动力场表面上仍可保持一定程度的近地转平衡,但热力与水汽等物理量在长时间积分中可能跳入一个失衡的新状态,从而推动气候态向一个新的方向重排。

左:盘古1990年7月1日起报预报对比ERA5物理量守恒检验序列(图a:大气内能守恒,图b:水汽质量守恒,图c:大气动能守恒),右:对应ERA5演变趋势值t检验95%置信范围与盘古演变趋势值大小(范围:1990年7月1日-2005年6月31日)

该结果实际上更有力地指向了AI模式在气候尺度缺乏硬物理约束时的结构性局限,它们可以在局地运动模式上保持相对合乎常理,但在总体的气候态守恒上难以保持一个平衡。热力与水汽等物理量在长时间积分中可能跳入一个失衡的新状态,但是又保持一种新平衡。

总结

总而言之,在极端非物理输入下,盘古会向某一稳定统计态收敛,体现出很强的统计吸引子纠错特征。但对于不同的初始场,这个气候态吸引子并不固定,而是可能在无外强迫约束下演化到多个内部平衡态之一。

研究的这一初步发现不同于平常认为人工智能模式的预报状态将会向一个固定的吸引子移动的认识,在气候尺度上,盘古模型的这种无自主时间概念的演化产生截然不同的稳态,充分体现了人工智能模型的“黑箱性”。

本文的诊断仍有几类关键局限:

其一,受计算与存储限制,部分平均分析的分辨率为3°,在风速等量上带来数量差异,部分偏差可能是重网格化和平均方式放大的结果。

其二,守恒检验采用了一些近似,如将高海拔地区陆地体积全部计算为空气,使得ERA5数据结果仍然会受到南北半球陆地不平衡的影响而产生季节性的数据波动。

其三,地转偏差风空间图出现条带噪点,使空间细节结论需要谨慎。

未来若要把趋势性证据推进为更强的物理结论,应在精细化分析、多预报结果等方向上进一步完善与验证。

2023年 飘洋过海的台风多拉 Dora

超强台风级

(本文内容如有不严谨之处,欢迎在评论区留言交流!)

学AI大模型的正确顺序,千万不要搞错了

🤔2026年AI风口已来!各行各业的AI渗透肉眼可见,超多公司要么转型做AI相关产品,要么高薪挖AI技术人才,机遇直接摆在眼前!

有往AI方向发展,或者本身有后端编程基础的朋友,直接冲AI大模型应用开发转岗超合适!

就算暂时不打算转岗,了解大模型、RAG、Prompt、Agent这些热门概念,能上手做简单项目,也绝对是求职加分王🔋

📝给大家整理了超全最新的AI大模型应用开发学习清单和资料,手把手帮你快速入门!👇👇

学习路线:

✅大模型基础认知—大模型核心原理、发展历程、主流模型(GPT、文心一言等)特点解析
✅核心技术模块—RAG检索增强生成、Prompt工程实战、Agent智能体开发逻辑
✅开发基础能力—Python进阶、API接口调用、大模型开发框架(LangChain等)实操
✅应用场景开发—智能问答系统、企业知识库、AIGC内容生成工具、行业定制化大模型应用
✅项目落地流程—需求拆解、技术选型、模型调优、测试上线、运维迭代
✅面试求职冲刺—岗位JD解析、简历AI项目包装、高频面试题汇总、模拟面经

以上6大模块,看似清晰好上手,实则每个部分都有扎实的核心内容需要吃透!

我把大模型的学习全流程已经整理📚好了!抓住AI时代风口,轻松解锁职业新可能,希望大家都能把握机遇,实现薪资/职业跃迁~

这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

需要专业的网站建设服务?

联系我们获取免费的网站建设咨询和方案报价,让我们帮助您实现业务目标

立即咨询