黄山市网站建设_网站建设公司_响应式网站_seo优化
2026/1/22 1:52:26 网站建设 项目流程

大家好,我是袋鼠帝。

2026年刚开年,AI圈子终于开始稍微安静一点了,不过各家似乎都在憋大招。

前两天我刷X的时候,发现美团居然悄悄咪咪又开源了一个新模型:LongCat-Flash-Thinking-2601。

不得不说,美团这个更新节奏是真滴卷。

我回忆了下,从去年9月发布Chat版本,到后来的Thinking版本,再到Omni全能版,他们的模型路走得非常稳。

这次的2601版本,更是全面提升了Agent和Thinking能力

不过真正吸引我去深入研究的,其实是 X 上的一条评论:它居然有8位思考者并行推理。

这一下子就勾起了我的好奇心,我们之前用的深度推理模式,大多是单线程的,就像一个人在走路,哪怕走得再快,也就是那一条路。

美团这个设计,像是直接开了一个AI专家团

趁着上周末去北京参加AIGC开发者大会的间隙,我把这个新模型好好研究了一下。

这一试,我发现它还真有点东西。

先给大家总结一下这次新模型更新的核心亮点(省流版):

1.泛化能力极强,在那种混乱的真实环境里表现很稳,在复杂随机任务中甚至优于Claude。

2.自动构建多个高质量环境;密集依赖关系图

3.多环境强化学习:扩展的DORA(我们的强化学习基础设施),支持大规模多环境智能体训练

4.核心创新叫Heavy Thinking Mode,也就是深度思考模式:

平行思维:通过多个独立的推理路径扩展思维广度

迭代式摘要:通过使用摘要模型来综合输出,增强深度,支持迭代推理循环。

在这个模式下,模型会启动并行思考,相当于你有多个不同领域的大脑在同时帮你琢磨同一件事。

另外,据说1M(100万)token的上下文版本也快来了。

光看参数也没意思,咱们直接上实测。

目前,深度推理模式可在LongCat AI平台免费体验

https://longcat.chat/

让美团AI团队解决问题

以后遇到问题不用焦虑了,可以试试美团这个AI团队,团队8人,效率极高,还有第9人是个小领导,总结发言,是个全方位思考的智囊团。

团建聚餐,专治众口难调

来个美团的拿手好戏,点餐

不过有点刁钻:

prompt:我们在深圳,有8个同事要聚餐,预算只有300元。小张不吃辣,小李对麸质过敏,小王必须喝冰美式,老板想吃地道的本地菜,剩下的4个人里有人在减肥,有人想吃重口味。请寻找最优性价比方案,并给出具体的点单组合和凑单攻略。

这要是让人来想,估计头发都得掉一把。

当时打开深度思考后,吓我一跳,原来这就是重度思考吗

屏幕上直接冒出来8条并行的思维链!直接多出来8个脑子

有一种从单行道突然变成8车道的开阔感

来看看 LongCat 的 8 位 Thinker 是怎么应对的。

它们分别给出了不同的策略:有的建议分开点外卖,有的推荐了性价比极高的潮汕套餐,还有的另辟蹊径建议去吃早茶。

这8个大脑并行工作完之后,还会有一个裁判角色的模型出来做总结,把各个方向的精华提炼出来,形成最终的答案。

俗话说三个臭皮匠顶个诸葛亮,美团这是直接给我安排了三个诸葛亮啊。

最后的综合方案很不错,模型经过权衡后发现,在深圳 300 块钱满足这么多人的堂食需求几乎是不可能的,所以最优解是点外卖,并且给出了具体的分店铺凑满减攻略。

最让我惊讶的是细节:它甚至提醒我,酱油里可能含有麸质,一定要给商家备注小李的过敏情况。

这种细致程度,单靠一条思维链是很容易遗漏的。这也体现了并行思考的优势:既有广度,又有深度。

而且速度依然很快,这也是我一直比较喜欢美团模型的一点,干活讲究效率

假如明天AGI到来?

前端时间,马斯克的访谈提到,AGI可能很快就会实现

所以我又问了一个稍微宏大一点的问题:假如明天AGI突然到来,世界会变成什么样?

这回的思维链就像是一场高质量的圆桌论坛,类似上周六我参与分享的圆桌会议

有的Thinker在分析对就业市场的冲击,有的在预测经济结构的重组,还有的在探讨人类认知的颠覆。

看着这 8 个大脑在屏幕上互搏,非常有意思。

它们各有各的观点,但最后又能达成某种共识。这和我们人类社会其实很像,真理往往就是在不断的辩论和碰撞中产生的。

法律智囊团:随身携带的律师天团

这个场景非常实用,假设我不小心在商场碰碎了一个标价8.8万的艺术品,商场态度强硬要我全额赔偿,那不是完犊子了?

我把情况描述给LongCat,让它做我的辩护律师。

prompt:我在商场行走时,背包不慎剐蹭到了摆放在转角处的一个艺术品展架,导致一件标价 8.8 万元的艺术瓷器摔碎。商场方目前态度强硬,拒绝任何调解,要求我按照标价全额赔偿。作为被告,我的抗辩点在于:展架位于人流量大的转角处,且没有任何物理防护(如玻璃罩);展架底座极轻,明显不符合摆放易碎重物的安全标准;我只是正常行走,并无跑跳等过激行为。请你作为我的专业辩护律师。

反应速度非常快,几个 Thinker 迅速从不同角度切入。

有的负责分析商场的过错,有的提到一些案例参考,还有的侧重风险评估和紧急措施。

它给出的一些答案,我怕是幻觉,还特地去核实了以下思维链中提到民法典1198条、1165条、1173条,也是正确的。

有点可惜的是重度思考暂时还没接入联网搜索,所以这块大家还是要谨慎,出的条款最好都去印证一下,毕竟思考模型普遍都会有幻觉,有出错的概率。把它当做辅助律师团即可。

最终回答:

不过对于我们普通人来说,遇到这种突发状况,能有这么一个智囊团,可以第一时间快速了解一些信息,心里真的会踏实很多。

中西结合的身心健康指导

有一些朋友和我聊起最近莫名不太好入睡,想起来下个月就过年了,

是丙午马年,丙火和午火双火叠加,六十年一遇,

部分朋友可能会有水火交战的情况,明明没有什么心烦的事情,却睡不着,赶紧来试试Longcat怎么说。

还有,我从小到大基本上午觉就没睡着过,可能是过度焦虑的原因?

很好玩的是,居然得到了中西结合的回答,还是那句话,集百家之所长,取其精华,去其糟粕,很好用。

如果是其他大模型,被我引导提问,就只会从中医的角度回答了。

下面豆包的回答,被我提问之后,只会从中医角度回答问题:

但 LongCat的 8 个Thinker 里,有的Thinker提供中医视角,有的提供现代医学视角,有的提供改善睡眠建议,真的是面面俱到,中西结合,完美!

以下是正文回答,有需要的朋友可以参考一下,也可以点赞转发,说不定你就有朋友也遇到了。

风格化写作,绝了

我让它用最强烈的文学风格描写一碗螺蛳粉,并且让它自己选择流派。

prompt:我现在手里端着一碗热腾腾的、闻起来臭吃起来香的螺蛳粉。 我希望看到风格极度强烈的文学描写。请选择一个你认为最有趣的文学流派(例如:鲁迅的冷峻讽刺、古龙的简洁萧杀、王家卫的暧昧破碎、张爱玲的华丽苍凉等等)。

8 位大作家开始吭哧吭哧写作。最后的评判环节非常有意思。有 5 位 Thinker 选择了张爱玲风格,2 位选了古龙,1 位选了王家卫。

按理说,少数服从多数,最后应该是张爱玲风格胜出。因为已经有5位部下都选了张爱玲风格,

毕竟作为领导,最轻松最不用担责的决策才是最经济的。

但那个负责总结的裁判模型展现出了惊人的批判性思维,它认为古龙那种简洁萧杀的风格,反而更能突出一碗螺蛳粉的江湖气,而且能避免答案的同质化。

最终输出的古龙风描写,文笔真的是一绝。

这也让我突然意识到,这种多模型并行思考加裁判决策的机制,可能真的代表了未来AI决策的一种新方向。

代码能力

Prompt:帮我设计一个猫猫狗狗挂饰网站的前端,要可爱风,写在一个HTML文件里

迅速完成了代码,购物车逻辑、结算功能都写了,交互体验也很流畅。

后来我又试着让它写一个大鱼吃小鱼的游戏。

它通过联网搜索参考了最佳实践,还自动给游戏里的鱼加上了 AI 判定,大鱼会追,小鱼会跑,可玩性瞬间提升了一个档次。

为什么美团这个模型值得关注?

美团这次的 Heavy Thinking Mode,本质上是在解决大模型思考深度不足的问题。

以前我们觉得大模型像个百科全书,问啥知道啥,但一遇到需要推理、规划的复杂问题就容易掉链子。

LongCat的思路是:既然一个脑子不够用,那就用八个。

通过并行推理(Parallel Thinking),先让思维发散出去,覆盖尽可能多的可能性;再通过迭代摘要(Iterative Summarization),把这些发散的思维收敛回来,提炼出最优解。

这就像我们在公司开会解决难题,先大家头脑风暴,各抒己见,这是广度。然后项目经理把大家的想法汇总、去重、优化,形成方案,这是深度。

而且美团在训练这个模型的时候,用了大量的合成环境和抗噪声训练,这意味着什么?

意味着这个模型不是温室里的花朵,它是真的被扔到那种充满了不确定性、信息不完整的真实环境里去摸爬滚打过的。

所以它在面对我们现实生活中那些乱七八糟的任务时,适应性会特别强。

写在最后

美团虽然在这一波大模型浪潮里起步不算最早的,但他们追赶的速度真的让人惊讶。

上周末我们几个博主聊天还在感慨,像 Meta、微软这些巨头,有钱有卡,但在大模型上也逐渐没啥声音了。

这也侧面反映,做大模型这事儿,门槛真的很高,不是谁都能一直在牌桌上的。

美团能坚持下来,并且不断有这种高质量的产出,说明他们对 AI 是有自己独立的思考和战略定力的。

如果你也对AI Agent感兴趣,或者在开发相关的应用,可以去试试这个LongCat-Flash-Thinking-2601。

可能会给你带来一些意想不到的惊喜。

点击关注下方账号,你将感受到一个朋克的灵魂,且每篇文章都有惊喜。

能看到这里的都是凤毛麟角的存在!

如果觉得不错,随手点个赞、在看、转发三连吧~

如果想第一时间收到推送,也可以给我个星标⭐

谢谢你耐心看完我的文章~

需要专业的网站建设服务?

联系我们获取免费的网站建设咨询和方案报价,让我们帮助您实现业务目标

立即咨询