一个选择加锁,一个选择换发动机。同一天,两家公司给出了AI的两种答案。回答的虽然是不同层次的问题,却指向了同一个方向。
Anthropic于本周6月9日发布了Claude Fable 5和Mythos 5,一模型两版本,用安全策略划分能力边界。次日,谷歌DeepMind发布DiffusionGemma,26B MoE开源模型,用文本扩散架构将本地推理速度拉升4倍。前后相差不到24小时,两家公司拿出了截然不同的AI产品哲学。
在AI行业从“谁更强”进入“谁能用得起、谁能安全地放出来”的新阶段,Anthropic和谷歌的选择恰好构成了两种路线哲学的典型样本:一个在能力之上加安全锁,一个在效率上换新引擎。
它们不是对手,而是同一张拼图的两块。
一把锁与一台发动机
Anthropic的选择是在能力之上加一把锁。
Fable 5和Mythos 5共享同一底层模型,区别在于安全策略的松紧。Fable 5内置风险分类器,高风险请求被降级到Opus 4.8处理;Mythos 5移除所有限制,仅向Project Glasswing下经过审核的机构开放。这套“降维安全学”的本质是:模型能力已经强到需要分级管理,于是用软件层面的开关划分使用权限。
谷歌的选择则是换一台发动机。
DiffusionGemma没有走主流大模型的自回归路线,那种逐token生成的“打字机”模式,而是将图像生成领域的扩散机制引入文本领域。它从一段随机噪声开始,一次性铺开256个token的“画布”,通过多次并行迭代逐步去噪,最终生成连贯文本。好比从打字机换成了印刷机,不是逐字敲出,而是一次排版、整体输出。
效果是显著的,单块H100上每秒生成1000+ tokens,消费级RTX 5090上700+,比同等规模的自回归模型快约4倍。量化后仅占18GB显存,这意味着一张消费级显卡就能本地运行。
但DiffusionGemma有一个明确的前提:它是实验性模型。谷歌官方没有回避这一点,输出质量低于自回归路线的Gemma 4。文本扩散架构在长文本连贯性和复杂推理任务上仍存在质量差距。这是用性能换速度的典型取舍:当生成速度提升4倍时,生成质量做出了让步。
这决定了DiffusionGemma的适用场景。它不是用来替代Claude Fable 5或GPT-5.5做复杂推理的,而是瞄准了低延迟、本地化、实时交互的应用场景——代码补全、实时翻译、本地AI助手、端侧推理。在这些场景中,速度的优先级高于单次输出的完美度。
Anthropic的选择则相反。Fable 5在SWE-bench Pro上得分78.6%,FrontierCode Diamond得分29.3%,全面领先前代和竞品。Stripe用它一天完成5000万行Ruby代码迁移,人工需要两个月。在Anthropic的价值排序中,能力上限是第一优先级,速度和安全都在其次。
两种路线没有对错之分,它们回答的是不同的问题,但共同揭示了AI行业正在发生的深层分野。
封闭与开源
Anthropic的商业模式建立在稀缺性之上。
Fable 5 API定价60美元/百万token,是Opus 4.8的两倍、GPT-5.5的1.7倍、DeepSeek-v4的46倍。在全行业AI价格持续走低的背景下,Anthropic逆势提价,赌的是绝对性能可以支撑溢价。Mythos 5则更进一步,用安全审核制造准入壁垒,将高端能力变成稀缺资源。这套分层模式的核心逻辑是:能力越强,越要控制供给。
谷歌的路线完全相反。
DiffusionGemma采用Apache 2.0许可证开源,权重开放下载,开发者可以在本地自由部署和修改。26B参数、MoE架构仅激活3.8B、量化后18GB显存。这些技术指标的设计目标很明确:让尽可能多的人在自己的设备上跑起来。
谷歌还与英伟达合作,从发布首日起就支持RTX和DGX全系列GPU。
这不是谷歌第一次走开源路线。从Gemma系列到DiffusionGemma,谷歌在开源大模型领域的投入持续加码。但DiffusionGemma的特殊之处在于,它不是在已有路线上做开源版本,而是开辟了一条全新的技术路线——文本扩散。这意味着谷歌不仅在开源模型,还在开源一种新的架构范式。
尽管路径迥异,两个产品在几个维度上指向了相同的行业趋势。
一个最直观的趋同方向是本地化,DiffusionGemma的目标场景就是本地推理,18GB显存门槛意味着消费级硬件即可运行。Anthropic虽然以云端API为主,但Fable 5的“自主反思和验证”能力,让模型自己检查自己工作,正是为了在无人值守的本地环境中实现自主任务。
两家公司从不同方向逼近同一个目标:让AI脱离云端依赖,在本地环境中独立运转。
另一个趋同方向在架构层面,DiffusionGemma证明了非自回归路线的可行性,文本扩散架构用并行生成替代顺序生成,从根本上改变了效率曲线。
Anthropic的Fable 5虽然仍基于自回归架构,但“一模型两版本”本身就是一种产品架构创新——不是用不同的模型满足不同需求,而是用同一个模型加不同的安全策略。当参数规模竞赛遇到边际收益递减,架构层面的创新正在成为新的竞争维度。
两条路线的交汇点
更深层的交汇在于护城河的迁移。
Anthropic用安全分层构建合规壁垒,谷歌用效率提升降低使用门槛。两家公司都在寻找参数规模之外的新竞争维度。Anthropic的安全体系越复杂,后来者越难复制;谷歌的DiffusionGemma速度越快,开发者越难拒绝。在AI能力逐渐趋同的未来,安全治理能力和效率优化能力可能比模型本身更能决定胜负。
一个容易被忽略的事实是,Anthropic和谷歌的这两款产品,恰好填补了对方路线的空白。Anthropic的Fable 5/Mythos 5走的是“能力最大化+安全管控”路线,但它缺乏一个轻量级、低成本、可本地部署的选项。对于不需要顶级推理能力、但需要低延迟本地响应的场景,Fable 5的API定价和云端依赖构成了门槛。
谷歌的DiffusionGemma走的是“效率优先+开源普惠”路线,但它缺乏一个顶级推理能力的旗舰模型。对于需要复杂推理、长文分析、高精度代码生成的任务,DiffusionGemma的实验性质量和非自回归架构的局限性使其难以胜任。
这两条路线不是竞争关系,而是互补关系。它们共同覆盖了AI应用光谱的两端:一端是云端高性能推理,一端是本地高效率生成。中间地带的融合,既能在本地运行、又具备顶级推理能力的模型,可能是下一阶段的竞争焦点。
从Opus 4.8到Fable 5仅11天,Anthropic完成了代际跨越。从自回归到文本扩散,谷歌用DiffusionGemma开辟了一条全新的技术路线。两家公司在同一个时间窗口内,用截然不同的产品哲学,各自回答了一个核心问题:AI能力持续增长之后,下一步往哪里走?
Anthropic的答案是加一把锁,用安全分层管理能力,用稀缺性支撑商业价值。谷歌的答案是换一台发动机——用架构创新降低门槛,用开源生态扩大覆盖。一把锁,一台发动机,指向的是同一个判断:AI行业的竞争维度正在从“谁更强”转向“谁能安全高效地让更多人用上”。
这场博弈的终局,将由市场来裁决。但一个趋势已经清晰可见:AI的下一轮竞争,拼的不再只是模型的大小,而是产品哲学的完整度和生态覆盖的广度。从今天起,这是一个需要重新评估的竞争格局。
(本文首发钛媒体APP,作者 | 硅谷Tech_news,编辑 | 焦燕)