台中市网站建设_网站建设公司_PHP_seo优化
2026/1/10 1:01:05 网站建设 项目流程

昨天,智谱AI(02513.HK)在香港交易所主板正式挂牌交易,成为全球首家以通用人工智能(AGI)基座模型为核心业务的上市公司。

智谱AI的上市首日表现亮眼,开盘价为120港元/股,最终收盘价达130港元/股,较发行价116.2港元上涨12%,总市值突破574亿港元。

今天持续走高,已暴涨至156.7港元/股,总市值高达689亿元,创造了中国AI领域的新纪录。

智谱AI的诞生,从清华实验室到创业新星

智谱AI的根源,可以追溯到近三十年前清华大学孕育的一段学术梦想。1996年,清华大学计算机系成立了知识工程实验室(KEG),这是国内最早开展自然语言处理(NLP)和知识图谱研究的实验室之一。

在这个实验室里,一群对人工智能充满热情的年轻人开始探索让机器理解和思考的道路。

唐杰,这位日后成为智谱AI灵魂人物的年轻学者,正是在KEG实验室中完成了他的博士学业,并逐渐成长为领域内的领军人物。

2006年,唐杰带领KEG团队发布了一款名为“AMiner”的科研情报挖掘系统。这个系统通过人工智能技术分析自然科学或技术发展的客观规律,构建了早期的知识图谱框架,为日后智谱AI的技术积累埋下了第一颗种子。

AMiner的问世并非偶然,它源于唐杰对当时科研环境的敏锐洞察:当谷歌学术已成为全球研究者的标配时,中文世界却缺乏一个同等效能的学术引擎。怀揣着独创中国人自己的技术的理想,唐杰和他的团队用行动填补了这一空白。

AMiner的成功让唐杰积累了丰厚的科研资本,也为智谱AI的诞生奠定了基础。从2013年开始,AMiner的商业化应用被提上日程,为国内的科研机构、科技企业等提供服务。

这种“带着客户和市场启动”的务实风格,从一开始就刻入了智谱AI团队的DNA。2019年,在国家相关政策的鼓励与支持下,清华大学教授李涓子、唐杰等人依托AMiner为基础,共同创立了智谱AI。

北京智谱华章科技有限公司正式注册成立,由清华大学的技术成果转化而来,致力于打造新一代认知智能通用模型。

智谱AI的创始班底堪称“全明星”阵容,汇集了KEG实验室的核心成员和清华系的顶尖科学家。

唐杰担任首席科学家,另一位清华校友刘德兵出任董事长,负责战略及业务方向。而公司的CEO则由张鹏担任。

张鹏同样毕业于清华大学计算机系,曾参与设计国内首个中英文平衡的跨语言知识图谱系统XLORE,是KEG实验室的核心成员之一。

这种前沿研究与商业落地并重的特质,从智谱AI创立之初就贯穿于其发展脉络中。成立当年,智谱AI就获得了4000万元人民币的天使轮融资,投资方包括清华大学资管和中科创星。

这笔资金为公司启动研发提供了“第一桶金”。更难能可贵的是,智谱AI从成立第一天起就拥有稳定的收入来源,这为其早期的大模型研发赢得了宝贵的缓冲时间。

公司依托KEG实验室的技术积累,为科技情报分析和数据挖掘提供解决方案,在创立初期便实现了“自带干粮”的创业模式。

从0到1的艰辛抉择

智谱AI的创业之路并非坦途,早期的发展充满了艰难的抉择和考验。2020年,全球AI行业迎来了一个重要的转折点。当年6月,OpenAI发布了震撼业界的GPT-3模型,其强大的生成能力让整个AI界为之震动。唐杰和张鹏等智谱AI的创始团队敏锐地意识到,大模型将是未来发展的方向。

然而,摆在智谱AI面前的是一个艰难的选择:是追随西方主流的技术路线,还是自主开辟一条属于自己的道路?

当时,国内市场对大模型的关注度极为有限,整个行业仍处于“前夜”阶段。OpenAI的GPT系列和谷歌的BERT架构分别代表了两种主流路径。GPT采用自回归的Transformer架构,擅长文本生成;

而BERT采用双向编码器(BidirectionalEncoder)架构,在理解上下文方面表现优异。

智谱AI团队没有简单地选择其中任何一条路线,而是做出了一个大胆的决定:从0起步,自主研发全新的预训练架构。

这个选择在当时看来并不显眼,甚至带有一定的“冒险”色彩。毕竟,追随OpenAI或谷歌的道路,意味着可以站在巨人的肩膀上,风险相对可控;而自研架构则是一条充满未知的道路,需要投入更多的人力、财力和时间。

然而,唐杰和张鹏等团队核心成员深知,要打破西方的技术垄断,实现中国在大模型领域的自主可控,就必须走出一条自己的技术路线。这种对自主创新和技术报国的执着,成为驱动智谱AI早期发展的核心动力。

2020年底,智谱AI正式开启了“悟道”项目的研发,全力投入大模型的开发。这一决策在当时并不被广泛看好,甚至遭到了内部一些工程师的质疑和反对。在2021年底的一次关键会议上,面对投入千万级的巨资可能让公司覆灭的风险,工程师们沉默以对,以示反抗。

此时的唐杰,作为公司的灵魂人物,展现出非凡的理想主义和战略定力。他坚定地表示,如果成功,至少证明中国的大模型公司,技术能力也能达到世界级水平。

他更宏大的目标是打破西方技术路径,打造中国自己的预训练模型框架。这一豪赌,最终将智谱AI带向了一个全新的高度。

ChatGPT问世后,AI大模型进入飞速发展

2022年11月30日,ChatGPT的横空出世,彻底改写了全球AI行业的节奏。ChatGPT凭借其强大的对话能力和惊艳的用户体验,瞬间引爆了市场,大模型从一个“冷门”的学术概念,变成了大众热议的焦点。

对于智谱AI而言,这既是巨大的机遇,也是前所未有的挑战。幸运的是,智谱AI在此前的技术先发优势使其能够迅速响应这场突如其来的AI革命。

早在ChatGPT发布前的2021年,智谱AI就训练出了百亿参数规模的模型GLM-10B,并利用混合专家(MoE)架构成功训练出收敛的万亿稀疏模型,技术实力初露锋芒。

更令人瞩目的是,2022年8月,智谱AI合作研发了中英双语千亿级超大规模预训练模型GLM-130B,并率先开源。这一时间点,比ChatGPT的发布早了整整三个月。

斯坦福大学大模型中心在2022年11月对全球30个主流大模型进行的评测中,GLM-130B成为亚洲唯一入选的大模型,充分证明了其技术实力。

ChatGPT的爆火,让大模型从一个“难落地”的前沿技术,变成了资本追逐的“香饽饽”。一夜之间,AI大模型赛道从冷清变得拥挤不堪,国内很快掀起了“百模大战”的热潮。

对于智谱AI而言,这既是证明自己的绝佳机会,也意味着竞争环境的急剧恶化。公司迅速进入了高速迭代期,模型发布的频率从“几年磨一剑”提升到了“每3个月一次”。

2023年3月14日,GPT-4发布的同一天,智谱AI推出了对标产品ChatGLM,并同步开源了参数规模仅60亿的ChatGLM-6B模型。这一时间节点的选择,被外界解读为一种“隔空叫板”的意味。

紧接着,智谱AI在同年6月和10月又先后推出了ChatGLM2和ChatGLM3,不断刷新着自己的技术纪录。

8月,智谱AI推出的生成式AI助手“智谱清言”成为首批通过大模型备案的产品,正式面向公众开放服务。这些快速迭代的举措,使智谱AI在“百模大战”中占据了先发优势。

随着产品能力的提升和开源策略的推行,资本市场的热情也空前高涨。2023年,智谱AI累计获得了超过25亿人民币的融资,投资方阵容豪华,包括社保基金中关村自主创新基金、美团、蚂蚁、阿里、腾讯、小米、金山、顺为、Boss直聘、好未来等众多知名机构,以及君联资本、启明创投等老股东。

这一年,智谱AI的估值从B1轮融资前的19亿元飙升至B6轮融资后的244亿元,完成了从初创公司到“独角兽”的华丽转身。资本的涌入为智谱AI加速技术研发和市场拓展提供了充足的“弹药”。

高增长与高亏损并行的现实

尽管智谱AI在技术和融资上取得了令人瞩目的成绩,但其商业化之路却并非一帆风顺。随着“百模大战”进入白热化,一个残酷的现实摆在所有大模型公司面前:如何将技术优势转化为可持续的商业回报?

智谱AI的财务数据清晰地描绘出一家典型AI大模型创业公司的画像:收入增长迅猛,但亏损同样巨大。

根据招股书披露,2022年至2024年,智谱AI的收入分别为5740万元、1.245亿元和3.124亿元,年复合增长率高达130%。

进入2025年,这一增长势头更为强劲,上半年收入达到1.91亿元,同比增长325%。

然而,同期公司的净亏损也迅速扩大:2022年至2024年,经调整后的净亏损分别为0.97亿元、6.21亿元和24.66亿元,三年累计亏损超过30亿元。2025年上半年,净亏损进一步扩大至23.58亿元。

巨额亏损的主要原因,是持续高强度的研发投入。2022年至2024年,智谱AI的研发投入分别为8440万元、5.289亿元和21.954亿元,2025年上半年更是高达15.947亿元,累计研发投入约44亿元,是同期营收的8倍以上。

截至2025年6月,公司研发人员占比高达74%,接近八成的员工都在从事技术工作。这种“烧钱换技术”的模式,与OpenAI、Anthropic等美国同行如出一辙,是AI大模型领域普遍面临的共同挑战。

AI群雄,逐鹿新战场

智谱AI敲响的上市钟声,不仅是自身发展的里程碑,更映射出中国大模型行业格局的深刻变革。曾经风光无限的“AI六小虎”:智谱AI、MiniMax、百川智能、月之暗面、零一万物和阶跃星辰,正经历一场剧烈的分化。

2025年初, DeepSeek的横空出世,以“低成本+高智能+全开源”的颠覆性模式,迅速成为全球焦点。以免费开源的策略获得了开发者社区的广泛支持,对包括智谱AI在内的所有商业模型公司构成了生态级的挑战。

与此同时,字节跳动和阿里两大互联网巨头全面下场,投入巨额资金布局AI基础设施和自研大模型。

字节跳动2026年的资本开支规划约1600亿元人民币,其中约850亿元用于AI芯片;阿里则启动了“三年3800亿”的新基建计划。

在人才争夺上,头部大厂更是不计成本,据行业报告,字节跳动已成为国内AI人才的头号金主,“六小虎”体系内2025年上半年有超过10位核心高管离职,不少加入了大厂阵营。

在这样的背景下,中国大模型市场的竞争格局正加速重塑。曾经追逐通用大模型的创业公司,不得不开始思考如何与巨头“共舞”。

零一万物已退出基础模型竞争,预训练团队整体并入阿里通义;百川智能转向医疗等垂直领域;月之暗面和MiniMax专注C端产品;阶跃星辰则在B端和C端同时布局。

有行业人士认为,最终能持续参与基础大模型竞争的玩家可能收敛为“基模五强”。DeepSeek、阿里、字节、阶跃和智谱。而更有预测称,中国最终只会剩下三家大模型公司。

面对巨头环伺和新兴对手的冲击,智谱AI选择了加码预训练投入,坚持走通用大模型的道路。

2025年下半年,智谱AI连续发布了GLM-4.5、GLM-4.6和GLM-4.7三代模型,技术性能不断攀升。GLM-4.5被定位为首款原生Agent基座模型,在12个评测基准中取得全球第三、国产第一的成绩。

GLM-4.6在真实环境编码测试中达到了与AnthropicClaudeSonnet4相当的水平,200K的超长上下文窗口较行业主流的128K提升了56%。

而最新的GLM-4.7模型,在全球百万用户盲测的CodeArena上与Anthropic、OpenAI的模型并列编码全球第一,超越了谷歌的Gemini和xAI的Grok。

这些技术上的激进姿态,为智谱AI赢得了外界的广泛认可,也为其在竞争中增添了更多底气。

智谱AI的上市,是敲响AI时代的钟声,更是新征程的起点。在敲钟仪式后的内部信中,创始人唐杰写道:“我们不是敲钟,我们只是拿到了下一场硬仗的入场券。”

这句话深刻揭示了智谱AI团队的清醒认知:上市并非终点,而是新的开始。

如何学习大模型 AI ?

由于新岗位的生产效率,要优于被取代岗位的生产效率,所以实际上整个社会的生产效率是提升的。

但是具体到个人,只能说是:

“最先掌握AI的人,将会比较晚掌握AI的人有竞争优势”。

这句话,放在计算机、互联网、移动互联网的开局时期,都是一样的道理。

我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

第一阶段(10天):初阶应用

该阶段让大家对大模型 AI有一个最前沿的认识,对大模型 AI 的理解超过 95% 的人,可以在相关讨论时发表高级、不跟风、又接地气的见解,别人只会和 AI 聊天,而你能调教 AI,并能用代码将大模型和业务衔接。

  • 大模型 AI 能干什么?
  • 大模型是怎样获得「智能」的?
  • 用好 AI 的核心心法
  • 大模型应用业务架构
  • 大模型应用技术架构
  • 代码示例:向 GPT-3.5 灌入新知识
  • 提示工程的意义和核心思想
  • Prompt 典型构成
  • 指令调优方法论
  • 思维链和思维树
  • Prompt 攻击和防范

第二阶段(30天):高阶应用

该阶段我们正式进入大模型 AI 进阶实战学习,学会构造私有知识库,扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架,抓住最新的技术进展,适合 Python 和 JavaScript 程序员。

  • 为什么要做 RAG
  • 搭建一个简单的 ChatPDF
  • 检索的基础概念
  • 什么是向量表示(Embeddings)
  • 向量数据库与向量检索
  • 基于向量检索的 RAG
  • 搭建 RAG 系统的扩展知识
  • 混合检索与 RAG-Fusion 简介
  • 向量模型本地部署

第三阶段(30天):模型训练

恭喜你,如果学到这里,你基本可以找到一份大模型 AI相关的工作,自己也能训练 GPT 了!通过微调,训练自己的垂直大模型,能独立训练开源多模态大模型,掌握更多技术方案。

到此为止,大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗?

  • 为什么要做 RAG
  • 什么是模型
  • 什么是模型训练
  • 求解器 & 损失函数简介
  • 小实验2:手写一个简单的神经网络并训练它
  • 什么是训练/预训练/微调/轻量化微调
  • Transformer结构简介
  • 轻量化微调
  • 实验数据集的构建

第四阶段(20天):商业闭环

对全球大模型从性能、吞吐量、成本等方面有一定的认知,可以在云端和本地等多种环境下部署大模型,找到适合自己的项目/创业方向,做一名被 AI 武装的产品经理。

  • 硬件选型
  • 带你了解全球大模型
  • 使用国产大模型服务
  • 搭建 OpenAI 代理
  • 热身:基于阿里云 PAI 部署 Stable Diffusion
  • 在本地计算机运行大模型
  • 大模型的私有化部署
  • 基于 vLLM 部署大模型
  • 案例:如何优雅地在阿里云私有部署开源大模型
  • 部署一套开源 LLM 项目
  • 内容安全
  • 互联网信息服务算法备案

学习是一个过程,只要学习就会有挑战。天道酬勤,你越努力,就会成为越优秀的自己。

如果你能在15天内完成所有的任务,那你堪称天才。然而,如果你能完成 60-70% 的内容,你就已经开始具备成为一名大模型 AI 的正确特征了。

这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

需要专业的网站建设服务?

联系我们获取免费的网站建设咨询和方案报价,让我们帮助您实现业务目标

立即咨询