中国何时做出最强大模型?马斯克:明年一季度

首页    中国何时做出最强大模型?马斯克:明年一季度

(文/陈济深 编辑/张广凯)

今日,有网友在社交媒体提问称:“中国大模型预计何时能够达到Anthropic的Fable水平?智谱GLM-5.2无疑缩小了差距。”特斯拉CEO马斯克对此回复称:“可能在(2027年)一季度。”

马斯克在社交平台X上回复网友提问,称中国大模型达到Fable水平“可能在(2027年)一季度”

马斯克在社交平台X上回复网友提问,称中国大模型达到Fable水平“可能在(2027年)一季度”

对于马斯克的言论,有AI业内人士认为,马斯克的预测相对保守,中美模型水平的时间差可能短于7个月。谷歌DeepMind首席执行官德米斯·哈萨比斯此前也表示,中国的人工智能模型在能力上可能“只差几个月”就能赶上海外。

Fable5下线,智谱GLM-5.2上桌

马斯克的这番判断正值Anthropic新模型引发全球讨论之际。

6月9日,美国大模型企业Anthropic发布了其有史以来最强AI模型——Claude Fable 5和Claude Mythos 5,该模型在软件工程、长程智能体闭环、复杂系统理解等领域具备行业领先的能力基准,并引发了该模型是否逼近通用人工智能(AGI)的能力边界的广泛讨论。

对于全球开发者而言,这类能力意味着模型不再只是回答问题或补全代码,而是能够参与真实工程流程,承担更复杂的开发者工作。

6月13日,美国商务部发布出口管制令,要求禁止向“非美籍用户”提供,最终Anthropic选择了全面下架了两款模型,并在回应中称“这是一个误会,相关漏洞已知且较为轻微”,暗示Fable 5系列模型后续会回归。

美国“一刀切”的政策不仅影响了包括Anthropic非美籍员工,也将美国的传统盟友排除在外。加拿大总理卡尼也发出“只有一个选择绝非好事”的警告,直言欧洲和加拿大过度依赖少数美国AI模型是“犯错”。

与出口管制相伴而来的,是美国头部闭源模型访问机制的收紧。

Anthropic 近期更新的身份验证政策显示,Claude 用户未来在某些情况下可能被要求验证年龄或身份,验证材料可能涉及政府证件、面部照片或视频等信息。几乎同一时期,OpenAI 也开始对部分 ChatGPT 用户触发身份核验。

这些变化共同指向一个趋势:前沿闭源模型的访问权,正从过去的账户订阅,逐渐转向更强调身份、地区和资格审核的准入机制。

就在美国对Anthroic下达出口管制当天,智谱发文预告了其最强模型GLM-5.2即将上线,同时留下了一段意有所指的话:“在一些前沿模型突然变得不可用的时刻,我们选择相信另一条路:前沿智能不应只属于少数人,也不应被少数规则随时收回。它应该开放、可用、可构建,并服务于每一位开发者。”

智谱发布《致开发者:GLM-5.2全量开放,前沿智能属于所有人》

智谱发布《致开发者:GLM-5.2全量开放,前沿智能属于所有人》

6月17日,智谱官宣GLM-5.2上线,以最宽松的 MIT 协议开放,允许免费商用,且线上推理不依赖海外算力,实现了可用的 1M 稳定上下文长程编程能力量级跃升。

架构层面,GLM-5.2 提出了 IndexShare 机制,每四层稀疏注意力共享同一个 indexer,从而在百万 token 上下文下将每 token 的计算量降低约 2.9 倍。

在 Artificial Analysis 综合榜单上,GLM-5.2 取得 51 分,跻身全球模型前三,并位列开源模型 SOTA;在 FrontierSWE、Terminal-Bench 等代码和长程任务权威基准上,GLM-5.2 与国际顶尖模型 Claude Opus 4.8 的差距收窄至 1%–4%。

Artificial Analysis综合智能榜,GLM-5.2跻身全球前三、位列开源模型SOTA

Artificial Analysis综合智能榜,GLM-5.2跻身全球前三、位列开源模型SOTA

从多个基准评测来看,基本处于比肩Claude Opus、Fable 5水平。这也代表开源模型的代码能力第一次达到了行业认可的顶尖闭源模型水平。

长程任务评测中,GLM-5.2在FrontierSWE等任务上比肩Claude Opus 4.8

长程任务评测中,GLM-5.2在FrontierSWE等任务上比肩Claude Opus 4.8

八项基准评测中,GLM-5.2与Claude Opus 4.8、GPT-5.5、Gemini 3.1 Pro同台

八项基准评测中,GLM-5.2与Claude Opus 4.8、GPT-5.5、Gemini 3.1 Pro同台



中国大模型,跻身模型“御三家”

在DeepSeek出现后一年间,中国大模型企业纷纷拥抱开源,开源模型军团迅速崛起,中国模型迅速拉平了和美国头部模型的差距。

在广受欢迎的AI模型访问平台OpenRouter上,中国模型的调用量已经从2024年底的1.2%升至超过50%,在总量上全面超越美国模型。

上周,使用量排名前四的模型均来自中国公司:DeepSeek、MiniMax、腾讯和小米。这些中国开源模型不仅在中国国内广受欢迎,其凭借高性价比和接近头部模型的性能也使得中国开源大模型在世界许多其他地区也备受青睐。

OpenRouter周调用榜,前四名(MiniMax、DeepSeek、腾讯、小米)均为中国模型

OpenRouter周调用榜,前四名(MiniMax、DeepSeek、腾讯、小米)均为中国模型

不过,调用量反超并不等同于前沿能力全面领先。很长一段时间里,中国模型更多被视为性价比平替、开源补充或单项能力追赶者。

随着今年年初OpenClaw(龙虾)和一人公司(OPC)引发的热潮,市场对AI的需求也升级到了如何满足智能体时代下真正复杂的开发者工作流和长程复杂任务。

GLM-5.2 的不同之处在于,它试图在智能体编程和长程复杂任务这些过去由 Claude、GPT 等闭源模型占优的场景中,进入同一竞争区间。

在今年春节期间,智谱GLM-5模型曾以Pony Alpha的隐身身份上线 OpenRouter,面向全球开发者免费开放 API 调用与体验。在全球技术圈引发了大范围的身份猜测,有大量开发者将其视为OpenAI、Anthropic、DeepSeek下一代旗舰模型,其从「单轮代码补全」到「智能体工程」的范式跃迁,奠定了国产开源模型的全球头部地位。

三月底发布的GLM-5.1则进一步强化了代码性能,8小时长程工作的能力也让中国大模型真正冲过了由Anthropic树立的编程可用基本线,本次GLM-5.2的出现不但补齐了5.1的短板,更是靠着扎实的后训练和泛化场景覆盖,把代码能力直接推进到世界一流模型的门口。

美国开源模型研究员Nathan Lambert评论称:“智谱GLM-5.2在当下在智能体能力超过了谷歌Gemini,这是一份极具分量的成就”,这也意味着曾经垄断全球模型头部能力的谷歌,OpenAI,Anthropic“御三家”铁三角,第一次出现了来自中国的模型企业。

美国开源模型研究员Nathan Lambert评价,GLM-5.2的智能体能力已超过谷歌Gemini

美国开源模型研究员Nathan Lambert评价,GLM-5.2的智能体能力已超过谷歌Gemini

在过去相当一段时间内,由于客观条件限制,美国AI巨头每次模型的迭代都会重新拉开和中国头部模型的差距,无论是Gemini 3.5 GPT-5.5和Opus 4.8的出现,而最新的Fable 5模型的出现则再次拉高了行业的天花板。GLM-5.2 已经在核心开发场景中接近 Claude Opus 4.8、Fable 5 等国际顶级闭源模型。其在智能体编程、长程任务执行等关键赛道上,进入了可与头部闭源模型正面比较的区间。

中国开源生态,给予全球模型平权入场券

智谱GLM-5.2的发布是中国AI大模型阶段性发展成果的一个缩影。

马斯克关于中国大模型可能在“一季度”达到 Fable 水平的判断,真正值得关注的并不是具体时间点是否精确,而是它反映出全球市场对中国前沿模型追赶速度的重新估值。

美国财富对此报道称:“美国对Fable和Mythos的禁令证明了中国在科技自给自足方面所采取的更广泛举措是正确的。自2022年拜登政府对先进芯片和芯片制造设备的销售实施管制以来,中国科技自给自足的步伐加快了。”

Counterpoint Research的研究副总裁尼尔·沙阿(Neil Shah)表示:“由于出口管制,中国目前并非处于技术前沿,但他们拥有自己的芯片和模型。”

值得关注的是,上线首日,GLM-5.2 即完成与华为昇腾、平头哥、摩尔线程、寒武纪、昆仑芯、沐曦、海光、壁仞等国产算力平台的全适配;此前发布的国产大模型 DeepSeek V4 也已完成该类国产算力生态的全栈适配,这也意味着,来自中国的全栈开放生态,正在赋能全球 AI 产业实现开放包容、互利共赢的生态繁荣。

当美国闭源前沿模型越来越像一张需要审核资格的通行证,GLM-5.2 给出的答案是另一条路:前沿能力不一定只能封闭在少数平台里,也可以被开源出来,交给全球开发者重新构建。

全球大模型竞争的格局里,第一次出现了一个既接近顶级闭源体验、又选择开放路线的中国变量。

马斯克那个引发热议的“2027年一季度”预测。从代际落后,到单点突破,再到如今在最硬核的智能体和长程复杂任务上“上桌同博”,中国大模型把追赶的计价单位从“年”缩短到了“月”。

从这个意义上说,GLM-5.2 不只是智谱的一次旗舰模型发布,而是国产大模型从“追赶叙事”进入“同桌竞争”的一个标志性节点。

2026-06-20 03:35:54