Google 2025年AI研究显示Gemini 3系列模型在推理、多模态和编程能力上实现重大突破,标志着AI从"工具"向"实用助手"转变。Gemini 3在编程领域表现卓越,与Google Antigravity共同推动AI辅助编程进入新时代,为开发者提供强大支持。同时,AI在科学发现、创意生成和应对全球挑战方面展现出巨大潜力,为未来技术发展指明方向。
2025即将结束!Google做了个年终回顾:2025 年 8 个研究突破领域
这是AI Agents(智能体)、推理与科学发现的一年。
总体摘要
- Gemini 3 系列模型在推理、多模态、效率与创造力方面实现了巨大飞跃。
- AI 正在重塑 Google 的产品,从 Pixel 10 到搜索,赋予其智能体能力。
- AI 正在推动科学进步,涵盖基因组学、医疗、数学、编程与量子计算。
- Google 优先关注 AI 安全、协作与应对气候变化等全球性挑战。
2025 年是研究取得非凡进展的一年。在人工智能领域,我们见证了其角色从“工具”向“实用助手”的转变:从“人们使用的东西”变成“可以投入工作的助手”。如果说 2024 年是为这一时代奠定多模态基础的一年,那么 2025 年就是 AI 真正开始“思考、行动并与我们共同探索世界”的一年。
一、世界级模型的突破
今年,在模型能力方面取得了显著进展,涵盖推理、多模态理解、模型效率与生成能力。从 3 月发布的Gemini 2.5,到 11 月推出的Gemini 3,再到 12 月发布的Gemini 3 Flash,我们不断突破边界。
Gemini 3 Pro基于最先进的推理能力构建,是我们迄今为止最强大的模型,旨在帮你实现任何创意。它在 LMArena 排行榜上名列前茅,并在“人类最后考试”(Humanity’s Last Exam)与 GPQA Diamond 等基准测试中重新定义了多模态推理标准。
Gemini 3 Flash price & benchmark table.
致力于让有用的 AI 技术触手可及,提供最先进的开放模型。我们的Gemma系列模型轻量且开放,今年我们为其引入了多模态能力,显著扩大了上下文窗口,增强了多语言支持,并提升了效率与性能。
二、用 AI 创新与改造产品
2025 年,继续推动 AI 从“工具”向“实用助手”演进,用全新的智能体能力改造了整个产品组合。我们重新定义了软件开发:从“辅助编程工具”迈向“与开发者协作的强大智能体系统”。关键进展包括 Gemini 3 出色的编程能力与 Google Antigravity 的推出,标志着 AI 辅助软件开发进入新时代。
这一演进也体现在我们的核心产品中:从 Pixel 10 的 AI 功能、搜索中的 AI 模式更新,到 Gemini 应用与 NotebookLM 等 AI 原生创新,后者还新增了 Deep Research 等高级功能。
三、赋能创造力,与 AI 共创
2025 年是生成式媒体变革的一年,为人们实现创意抱负带来了前所未有的能力。视频、图像、音频与虚拟世界的生成模型与工具变得更高效、更普及。我们与创意产业合作开发工具如 Flow 与 Music AI Sandbox,优化创意工作流程,并通过 Google Arts & Culture 实验室的 AI 体验、Gemini 应用中图像编辑的重大升级,以及 Veo 3.1、Imagen 4 与 Flow 等新模型,拓展了创意可能性。
Google Labs 是我们分享 AI 实验的舞台。今年最受欢迎的实验包括:Pomelli(品牌营销内容 AI 实验)、Stitch(将提示与图像转化为复杂 UI 设计与前端代码)、Jules(异步编程智能体)与 Google Beam(3D 视频通信平台,用 AI 推进远程呈现)。
四、推动科学与数学进步
2025 年也是 AI 推动科学飞跃的一年,涵盖生命科学、健康、自然科学与数学。
在基因组学领域,我们已深耕 10 年,今年更进一步:从测序走向用 AI 解读最复杂的数据。我们还迎来了 AlphaFold 的五周年——这一诺奖系统解决了长达 50 年的蛋白质折叠难题,已被全球 190 多个国家的 300 多万研究人员使用,其中超 100 万来自中低收入国家。
Gemini 的 Deep Think 能力也在数学与编程领域创下历史:在国际大学生程序设计竞赛(ICPC)与国际数学奥林匹克(IMO)中均达到金牌水平。
五、塑造计算与物理世界的创新
在量子计算、能源与“登月计划”等领域引领重大发现。2025 年,量子计算迈向实际应用,Quantum Echoes 算法展现突破,Google 员工 Michel Devoret 与两位合作者荣获诺贝尔物理学奖。
- Project Suncatcher:探索太空可扩展 AI 基础设施设计(2025 年 11 月)
- Google 员工 Michel Devoret 获诺贝尔物理学奖(2025 年 10 月)
- Quantum Echoes:量子计算实际应用的重要一步(2025 年 10 月)
继续推进 AI 核心基础设施,发布专为“推理时代”设计的 TPU——Ironwood,并采用 AlphaChip 方法设计芯片,同时承诺衡量技术环境影响。
- 关于 Ironwood TPU 的三件事(2025 年 11 月)
- Google AI 能耗多少?我们算了一下(2025 年 8 月)
- Ironwood:首个为推理时代设计的 Google TPU(2025 年 4 月)
在机器人与视觉理解方面取得进展,推出 Gemini Robotics 与 Gemini Robotics 1.5,以及通用世界模型 Genie 3,让 AI 智能体进入物理与虚拟世界。
- Gemini Robotics 1.5 让 AI 智能体进入物理世界(2025 年 9 月)
- Genie 3:世界模型的新前沿(2025 年 8 月)
- Gemini Robotics:让 AI 进入物理世界(2025 年 3 月)
六、应对全球挑战与规模化机遇
2025 年,Google将 AI 科学进展直接应用于全球最紧迫的挑战。通过前沿模型与智能体推理,我们提升了对地球系统的理解,并在气候韧性、公共卫生与教育等领域产生实际影响。例如,洪水预警已覆盖 150 个国家的 20 多亿人;WeatherNext 2 模型预报速度提升 8 倍,分辨率可达 1 小时。
- WeatherNext 2:我们最先进的天气模型(2025 年 11 月)
- Google Earth AI 更新与更多开放(2025 年 10 月)
- Google Earth AI:我们的地理空间 AI 模型(2025 年 7 月)
- AlphaEarth 以空前细节绘制地球(2025 年 7 月)
- 用 AI 支持热带气旋预测(2025 年 6 月)
- FireSat:更早发现野火的系统(2025 年 3 月)
我们与伙伴合作,将 AI 科学进展应用于疾病管理与治疗发现。
- Cell2Sentence-Scale 27B:Gemma 模型助力发现潜在新癌症疗法(2025 年 10 月)
- AMIE 用于纵向疾病管理:从诊断到治疗(2025 年 3 月)
AI 也在教育领域发挥强大作用,通过 LearnLM 与 Gemini 中的 Guided Learning,激发好奇心与理解力。我们还将 Gemini 的翻译能力引入 Google 翻译,实现更自然、准确的翻译,并试点语音到语音翻译。
七、责任与安全优先
将研究突破与严谨、前瞻的责任与安全工作相结合。Gemini 3 是我们迄今为止最安全的模型,经历了 Google AI 史上最全面的安全评估。我们也在探索通往 AGI 的负责任路径,强调 readiness、主动风险评估与社区协作。
八、与产业、学界与公民社会的前沿合作
推动 AI 前沿 responsibly 需要全社会协作。2025 年,我们与顶尖 AI 实验室共同成立“Agentic AI 基金会”,推动开放标准,确保 AI 智能体的负责任与互操作未来。我们与迈阿密-戴德县学区、Raspberry Pi 等合作,为学生提供 AI 技能;与 UC Berkeley、耶鲁、芝加哥大学等研究合作,推动前沿研究.
展望未来
展望 2026 年,Google将继续安全、负责任地推进前沿,造福人类。
https://blog.google/technology/ai/2025-research-breakthroughs/#ai-productshttps://research.google/blog/google-research-2025-bolder-breakthroughs-bigger-impact/如何学习大模型 AI ?
由于新岗位的生产效率,要优于被取代岗位的生产效率,所以实际上整个社会的生产效率是提升的。
但是具体到个人,只能说是:
“最先掌握AI的人,将会比较晚掌握AI的人有竞争优势”。
这句话,放在计算机、互联网、移动互联网的开局时期,都是一样的道理。
我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。
我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。
第一阶段(10天):初阶应用
该阶段让大家对大模型 AI有一个最前沿的认识,对大模型 AI 的理解超过 95% 的人,可以在相关讨论时发表高级、不跟风、又接地气的见解,别人只会和 AI 聊天,而你能调教 AI,并能用代码将大模型和业务衔接。
- 大模型 AI 能干什么?
- 大模型是怎样获得「智能」的?
- 用好 AI 的核心心法
- 大模型应用业务架构
- 大模型应用技术架构
- 代码示例:向 GPT-3.5 灌入新知识
- 提示工程的意义和核心思想
- Prompt 典型构成
- 指令调优方法论
- 思维链和思维树
- Prompt 攻击和防范
- …
第二阶段(30天):高阶应用
该阶段我们正式进入大模型 AI 进阶实战学习,学会构造私有知识库,扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架,抓住最新的技术进展,适合 Python 和 JavaScript 程序员。
- 为什么要做 RAG
- 搭建一个简单的 ChatPDF
- 检索的基础概念
- 什么是向量表示(Embeddings)
- 向量数据库与向量检索
- 基于向量检索的 RAG
- 搭建 RAG 系统的扩展知识
- 混合检索与 RAG-Fusion 简介
- 向量模型本地部署
- …
第三阶段(30天):模型训练
恭喜你,如果学到这里,你基本可以找到一份大模型 AI相关的工作,自己也能训练 GPT 了!通过微调,训练自己的垂直大模型,能独立训练开源多模态大模型,掌握更多技术方案。
到此为止,大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗?
- 为什么要做 RAG
- 什么是模型
- 什么是模型训练
- 求解器 & 损失函数简介
- 小实验2:手写一个简单的神经网络并训练它
- 什么是训练/预训练/微调/轻量化微调
- Transformer结构简介
- 轻量化微调
- 实验数据集的构建
- …
第四阶段(20天):商业闭环
对全球大模型从性能、吞吐量、成本等方面有一定的认知,可以在云端和本地等多种环境下部署大模型,找到适合自己的项目/创业方向,做一名被 AI 武装的产品经理。
- 硬件选型
- 带你了解全球大模型
- 使用国产大模型服务
- 搭建 OpenAI 代理
- 热身:基于阿里云 PAI 部署 Stable Diffusion
- 在本地计算机运行大模型
- 大模型的私有化部署
- 基于 vLLM 部署大模型
- 案例:如何优雅地在阿里云私有部署开源大模型
- 部署一套开源 LLM 项目
- 内容安全
- 互联网信息服务算法备案
- …
学习是一个过程,只要学习就会有挑战。天道酬勤,你越努力,就会成为越优秀的自己。
如果你能在15天内完成所有的任务,那你堪称天才。然而,如果你能完成 60-70% 的内容,你就已经开始具备成为一名大模型 AI 的正确特征了。