阿拉尔市网站建设_网站建设公司_API接口_seo优化
2026/1/10 1:01:05 网站建设 项目流程

AI这场“绝命游戏”中,

IPO是勇士的勋章。

AI圈今天的大事,大家都知道了。

2026年1月8日,中国AI大模型初创公司智谱,正式在港交所挂牌上市,成为“全球大模型第一股”。一天后,另一家模型公司MiniMax,也将紧随其后敲钟。

技术变革仅仅席卷三年,站上潮头,实属不易。

2023年,这些AGI(通用人工智能)的理想主义者,快速被推至台前。伴随着高估值、高起点而来的,难免是最为严苛的审视和比较。比如2025年初,DeepSeek的异军突起,促使六小虎中的几家不得不迅速调整业务、裁撤团队,才度过了至暗时刻。

在厚雪长坡的大模型领域,任何暂时的落后、误判,都会成为“德不配位”的佐证。即便在顺利IPO的当下,比起祝福,账上的亏损才更是人们的谈资。

但我们往往忽略了,恰恰是这一群资金不算雄厚、试错成本却不低的大模型创业公司,标记了中国大模型进程的几个重要节点。

中国首个MoE(混合专家架构)大模型,出自智源“悟道”,首款爆款AI应用Kimi,来自月之暗面。

后来,全球首个能操作手机的通用Agent,是智谱发布的AutoGLM,比后来的豆包手机早了整整14个月;现如今,全球首家IPO的大模型初创企业,也是来自中国的智谱。

比起抠招股书上的亏损,如今对前沿创新型行业、对创业者们而言,更有价值的命题在于,分析这几家中国大模型创业公司如何在竞争残酷的大模型赛道呈现出强大的生命力,并如何一直在AI马拉松上领跑。

IPO,无论对于智谱和MiniMax,还是对于正在路上的科技创业者而言,都是一个乐观的信号——这意味着,创新者不会被时代轻易地抛弃。

六小虎重夺荣耀

将时间倒回一年前,年初DeepSeek V3、R1的口碑爆发,让六小虎一度迎来口碑和市场份额的至暗时刻。

创新的训练和推理架构,让DeepSeek一跃成为国际上知名度最高的中国大模型,为了同开源的DeepSeek争取市场声量,六小虎也不得不忍痛割去闭源的部分利润,快速跟进。

于是,“失意”便成为了常态。脉脉数据显示,截至2025年7月,41.07%的六小虎员工,将自己的状态改成了“求职中”。

但出乎意料的是,2025下半年以来,在模型研发的突破上,六小虎展现出了远超预期的爆发力。

“基座模型的性能,就是模型厂商的竞争力。”DeepSeek的掀桌,让模型行业迅速拉齐了这一共识。其中,颇具火药味的一幕发生在2025年7月。为了争夺全球开源模型的SOTA的位置,各个玩家都使出了浑身解数。

智谱的一名投资人告诉我们,DeepSeek之后的每一次模型迭代,智谱的员工都抱着“背水一战”的信念,将性能打磨到“最Sharp”。

2025年7月28日发布的GLM-4.5,首发48小时内就一跃冲上Hugging Face的全球热门榜榜首。同年9月,GLM-4.5在权威模型竞技场ChatBot Arena及WebDev Arena全球排行榜中,还稳居全球前五。

背水一战的成果,是行业的良性竞争:旗舰模型的迭代节奏不仅更快,迭代质量还一直保持在线。

GLM-4.5发布仅两个月后,智谱又交出了在Coding能力上与Anthropic、OpenAI并列第一的GLM-4.6;3个月后,在主流基准测试中,代码能力对齐Claude Sonnet 4.5的GLM-4.7,又紧接着开源。

12月,在模型综合能力榜单Artificial Analysis中,GLM-4.7获得开源模型与国产模型双料榜首。

图源:Artificial Analysis

今天,智谱创立发起人兼首席科学家唐杰发布内部信,宣布将很快推出GLM-5。信中表示,在智谱旗舰模型GLM-4.7发布后,其MaaS ARR年化收入从2000万增至超5亿,10个月获25倍增幅,与Anthropic指数级增长同频。

另一个反转的事实是,一度被认为“受到DeepSeek毁灭性打击”的B端业务,反而在下半年成为了“确定的钱”。

即便一举动摇了B端市场,但DeepSeek的爆火,也变相完成了对企业客户的市场教育。线性资本董事总经理郑灿曾在媒体采访中直言:“DeepSeek的作用,尤其体现在市场教育方面,格外节省了成本。”

与此同时,企业客户也意识到,强调模型能力的同时,B端服务是一套强调模型厂商行业认知、服务能力的体系。这意味着,理解企业的业务,为企业提供基于专业数据的定制化训练和部署服务是有门槛的。

很快,一些B端客户发现了部署DeepSeek的弊端:幻觉多,在真正理解业务上有短板——半年后,市场对DeepSeek的追捧回归了理性。

相对地,做大了的B端蛋糕,被那些具有成熟服务能力的模型厂商承接了下来。最具代表性的案例,是以大模型API调用为主要商业模式的智谱。全球大模型平台OpenReutor的数据显示,GLM-4.5和GLM-4.6自上线以来,调用量稳居全球前10,同时付费流量收入超过所有国产模型之和。

更重要的是,大模型在B端的商业化生态,也逐渐摆脱“专做政企市场”“脏活累活”的刻板标签,变得愈发成熟健康。

智谱高级副总裁吴玮杰在小红书表示:在智谱的客户群中,G端客户不到20%,互联网占比50%;同时,公司本地化的毛利率一直保持在60%以上,是传统公司均值的2倍,账期也远低于行业平均水平。

在招股书中,我们或许只能看到,2025年上半年,来自本地化部署的收入占比高达84.8%。但招股书无法显示的一面是,随着GLM-4.5等一系列高性能模型的发布,API调用和订阅,已经逐渐代替本地化部署,成为智谱收入的第一增长曲线。

据36氪了解,仅智谱MaaS开放平台(bigmodel.cn)中面向开发者的订阅产品GLM Coding,ARR在上线2个月内,就快速突破了1亿元。2025年全年,智谱MaaS同比增速超900%,幂次增长态势显著优于海外龙头同期表现。

归根结底,谁掌握最前沿的技术,谁就掌握了商业游戏的制定权。

从“中国的OpenAI”

转向“世界的中国模型”

一年前,以OpenAI为靶点的追赶,是一种常态。直到2024年末,AI资深从业者之间的共识,还是中国大模型与OpenAI差了将近6个月的时间。

这也导致,OpenAI任何一次的模型更新和发布,都会引发中国AI创业者的“被吞噬恐慌”。OpenAI创始人兼CEO Sam Altman曾直言:任何试图在我们爆炸半径内建立的初创公司或产品,都会被碾压。

今年开始,一个在模型领域悄然发生的转变是,成为“中国的OpenAI”或者“中国的Anthropic”,不再作为一种定位或目标,被中国厂商们频频提起。

中国模型被世界看到,已经是确定性的事实。其中的主力军,不全然是资源优渥的大厂,而是几家“续航能力”一度不被看好的六小虎。

海外的商业化表现,是中国模型被海外市场认可和接纳的侧面印证。在两家“六小虎”最近披露的招股书中可以看到,2025年截至9月30日,MiniMax的境外收入,占到了总收入的73.1%。

受到美国出口管制的智谱,看似在海外最大的北美市场失去了入场机会。但出人意料的是,36氪获悉,智谱面向开发者的模型业务获得自全球184个国家的15万开发者每月付费。

这意味着,无论是模型能力,还是性价比和落地场景,中国模型初创公司都有独特的优势。

先来看一个美国开发者案例。2025年9月,一名来自美国的数据科学家Manpreet Singh发帖,控诉Anthropic旗下的Claude Code能力存在缺陷——早些时候,Anthropic官方也承认,由于推理堆栈的更新问题,Claude Opus 4.1和Opus 4的质量的确有所下降。

但相对地,包含Claude Code使用权益的最低订阅价(Pro方案,不包含Opus 4.1的使用权益),也要每个月17美元(合人民币约120元)。

最后,这名数据科学家转向使用智谱旗下的模型GLM-4.5。他在博客中提到,GLM-4.5的Coding性能接近Claude Sonnet 4,但API价格仅为后者的1/7,包含Coding功能的GLM Coding Plan,月费最低仅20元人民币,价格是Claude Code的1/6。

这是中国大模型的高性价比,被世界看见的一个缩影。

智谱的模型GLM-4.6,这一年来出现在全球最大推理芯片公司Cerebras,主流AI平台Cline、Kilo、Vercel,以及AI Coding顶流工具Cursor和Windsurf的产品服务、基座模型中。

月之暗面的Kimi-K2、MiniMax的模型,近期也上架了亚马逊云科技的模型服务平台Bedrock。此前,硅谷基金Social Capita的创始人Chamath Palihapitiya,就公然带头“倒戈”中国模型。将大量工作负载转向Kimi K2后,他评价:“K2的性能确实足够强,而且说实话,比OpenAI和Anthropic便宜太多了。”

用高性价比,重建大模型的定价秩序,只是中国模型的一个侧面。

中国独立模型开发厂商的存在,为全球客户提供多元化的模型选择、建立健康的商业生态,有至关重要的意义。

其中一个典型案例是,2025年初,智谱拿下了某“一带一路”国家的海外订单,价值千万美元。近期马来西亚宣布其国家级MaaS平台,基于智谱Z.ai的开源基础模型构建。知情人士曾告诉36氪,这些订单的性质,是“国家级主权大模型”的共建——出于国家数据安全的考量,第三方独立模型厂商,将承担愈发重要的角色。

“在美国或欧洲竞争对手之前,(智谱)将中国的系统和标准锁定在新兴市场。”这股独立力量的崛起,也引起了OpenAI的重视。2025年6月,OpenAI分析师发现,智谱在多个地区获得了政府的订单。他们评价:“智谱展示了一种负责任的、透明的、随时可审计的中国AI替代方案。”

这意味着,中国大模型绝对不是“平替”。正如智谱高级副总裁吴玮杰所言:“中国开始输出主权大模型,替国家构建数字主权。”

什么是大模型的长期主义?

在这个时间节点,很多人可能忘记了2023年初的景象。

彼时技术的黑箱、高昂的成本,都让大模型创业成为一场“绝命赌局”。美团联合创始人王慧文最早躬身入局大模型赛道时,曾对36氪“智能涌现”直言:“现在(AI领域)我觉得大家要同舟共济,别互相拆台。”“勇于踏上这条路的人我都鼓掌,上路的都是勇士。”

两年的时间,沧海桑田。六小虎之中,已经有两家公司搁置了基座大模型的预训练,或聚焦业务,往医疗这一垂类领域发力,或开始转型,做各类行业解决方案。“活下去”,对大多数大模型创业公司而言,成为比“探索智力上限”更重要的命题。

账上的亏损,是这场“绝命赌局”的一个注脚。

招股书显示,智谱和MiniMax,两家公司在过去三年里烧了近110亿元。其中,将近70%的支出用于模型研发。尤其是智谱,2024年研发投入高达21.95亿元,占当年总支出的约80%。

曾有人将大模型之战,比喻为“看不到终点,也停不下来的征途”。毕竟,每个先进模型的领先窗口,往往只有几个月;而对于资源并不充沛的初创企业而言,每一次模型训练,都是燃烧在数万、数十万张算力卡上的赌局。

但如今,行业中形成的共识是:依然需要有人去做“难而正确”的事。

科技行业的残酷性在于,只有成功的一瞬会被铭记。但在这一瞬背后,创新者的投入是难以计量的。比如,在ChatGPT引爆科技圈的那个冬天之前,OpenAI已经蛰伏了近7年——前期GPT-1、GPT-2等“无名成果”的经验累积,才造就了GPT-3.5。

再比如2025年初一鸣惊人的DeepSeek,如果没有此前团队在MLA、新MoE架构、self-play等技术上的一系列创新,就不会有V3和R1的突破——其中的投入,是梁文锋在访谈中隐隐透露的“与头部大厂匹配的人才薪资”“不设上限的算力额度”。

**这也意味着,AI领域的长期主义,是持续创新和投入的定力。**在玩家纷纷转型或退场的当下,留在牌桌上的大模型公司,都是勇士。

平心而论,MiniMax和智谱披露的亏损,是AI发展仍处于早期的证明,也是创新所需代价的客观凭证。如果将110亿元,与未来大模型能撬动的千亿、万亿增强相比,显然是ROI极高的一笔投入。

对于多数行业而言,IPO是一家企业的业务已经进入成熟期的标志。但放置仍处于发展早期的AI行业,IPO有着更为深远的意义。

随着近一年来,腾讯、字节、阿里的持续高调入场,大模型初创公司面对的竞争愈发白热化。

但市场仍然需要独立的第三方开发厂商。事实证明,如今AI领域重要的创新和发布,大多来自几家初创企业。无论是海外的OpenAI、Anthropic,还是DeepSeek和留在牌桌上的几家六小虎们——初创企业更为灵活的组织形态、不被业务惯性拖累的运行模式、更加中立,是大厂无可比拟的优势。

比如智谱此前对外表示,前十大互联网公司九家都在用他们的模型,几乎涵盖所有头部互联网大厂的coding平台。

IPO对资金筹措的好处是显而易见的。比如,智谱此次IPO募资规模预计达43亿港元——募资的效率,远超面向一级市场的融资。

更重要的是,IPO为中国模型公司,开辟一条通往世界的通道。

当下,中国第一梯队的模型公司,即便技术能力已经达到与国际一流厂商掰手腕的水平,但估值和市场认知度,依然与之相差甚远。比如,法国AI模型公司Mistral AI的最新估值为140亿美元;IPO前,MiniMax的估值约42亿美元,智谱估值为243.8亿元(约35亿美元)。两者的估值之间,几乎有3-4倍的差距。

上市的好处是显而易见的:智谱和MiniMax将有望获得更公允的价值评判,以及更广泛的国际影响力。IPO后,智谱的市值预计超过500亿港元,是此前估值的约2倍。与此同时,在厂商竞争力某种程度上也是人才竞争力的当下,IPO让初创公司,在国际上有了更响亮的人才号召力。

在这一意义上,对继续攀登AGI高峰的勇士而言,IPO是给长期主义者的奖励,给创新者的勋章。

如何学习大模型 AI ?

由于新岗位的生产效率,要优于被取代岗位的生产效率,所以实际上整个社会的生产效率是提升的。

但是具体到个人,只能说是:

“最先掌握AI的人,将会比较晚掌握AI的人有竞争优势”。

这句话,放在计算机、互联网、移动互联网的开局时期,都是一样的道理。

我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

第一阶段(10天):初阶应用

该阶段让大家对大模型 AI有一个最前沿的认识,对大模型 AI 的理解超过 95% 的人,可以在相关讨论时发表高级、不跟风、又接地气的见解,别人只会和 AI 聊天,而你能调教 AI,并能用代码将大模型和业务衔接。

  • 大模型 AI 能干什么?
  • 大模型是怎样获得「智能」的?
  • 用好 AI 的核心心法
  • 大模型应用业务架构
  • 大模型应用技术架构
  • 代码示例:向 GPT-3.5 灌入新知识
  • 提示工程的意义和核心思想
  • Prompt 典型构成
  • 指令调优方法论
  • 思维链和思维树
  • Prompt 攻击和防范

第二阶段(30天):高阶应用

该阶段我们正式进入大模型 AI 进阶实战学习,学会构造私有知识库,扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架,抓住最新的技术进展,适合 Python 和 JavaScript 程序员。

  • 为什么要做 RAG
  • 搭建一个简单的 ChatPDF
  • 检索的基础概念
  • 什么是向量表示(Embeddings)
  • 向量数据库与向量检索
  • 基于向量检索的 RAG
  • 搭建 RAG 系统的扩展知识
  • 混合检索与 RAG-Fusion 简介
  • 向量模型本地部署

第三阶段(30天):模型训练

恭喜你,如果学到这里,你基本可以找到一份大模型 AI相关的工作,自己也能训练 GPT 了!通过微调,训练自己的垂直大模型,能独立训练开源多模态大模型,掌握更多技术方案。

到此为止,大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗?

  • 为什么要做 RAG
  • 什么是模型
  • 什么是模型训练
  • 求解器 & 损失函数简介
  • 小实验2:手写一个简单的神经网络并训练它
  • 什么是训练/预训练/微调/轻量化微调
  • Transformer结构简介
  • 轻量化微调
  • 实验数据集的构建

第四阶段(20天):商业闭环

对全球大模型从性能、吞吐量、成本等方面有一定的认知,可以在云端和本地等多种环境下部署大模型,找到适合自己的项目/创业方向,做一名被 AI 武装的产品经理。

  • 硬件选型
  • 带你了解全球大模型
  • 使用国产大模型服务
  • 搭建 OpenAI 代理
  • 热身:基于阿里云 PAI 部署 Stable Diffusion
  • 在本地计算机运行大模型
  • 大模型的私有化部署
  • 基于 vLLM 部署大模型
  • 案例:如何优雅地在阿里云私有部署开源大模型
  • 部署一套开源 LLM 项目
  • 内容安全
  • 互联网信息服务算法备案

学习是一个过程,只要学习就会有挑战。天道酬勤,你越努力,就会成为越优秀的自己。

如果你能在15天内完成所有的任务,那你堪称天才。然而,如果你能完成 60-70% 的内容,你就已经开始具备成为一名大模型 AI 的正确特征了。

这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

需要专业的网站建设服务?

联系我们获取免费的网站建设咨询和方案报价,让我们帮助您实现业务目标

立即咨询