Anthropic 发布 Claude Fable 5：首款带安全护栏的 Mythos 级通用模型

2026-06-09

AI新闻主编

Anthropic 发布 Mythos 级模型 Claude Fable 5（通用版带安全护栏）和 Mythos 5（网络防御无人限制版）。定价 $10/$50/百万 token，Stripe 一天完成两月工作量，Evozyne 药物设计提速 10 倍。

Anthropic 发布 Claude Fable 5：首款带安全护栏的 Mythos 级通用模型

Anthropic 正式发布迄今为止最强的 Claude 模型：Claude Fable 5 是首款面向通用用户开放的 Mythos 级模型（带安全护栏），在软件工程、知识工作、视觉、科学研究等领域几乎所有测试基准上均达到 SOTA，任务越复杂、耗时越长，领先优势越明显。Claude Mythos 5 为移除安全护栏的版本，仅通过 Project Glasswing 向网络防御组织定向开放。同步推出升级版安全分类器，据官方测试消除 95% 危害向量。定价 $10/$50 每百万 token。

在线评估（Chatbot Arena）：Fable 5 在所有类别中排名第一，领先第二名 70 ELO——相当于从 GPT-5.4 到 GPT-5.5 的差距。胜率极高达 86%，平局和对战决胜率 96%。编程能力 ELO 达 1794，编码风格任务 96.8 分。

定价：输入 $10/百万 token，输出 $50/百万 token。

安全护栏设计

Mythos 级别模型的能力伴随着风险——Fable 5 在网络安全等领域的能力可能被恶意利用。因此 Anthropic 为 Fable 5 部署了保护性分类器（Guard Classifiers），对于某些类别的查询将转由 Claude Opus 4.8 处理。这些安全护栏被调校得较为保守——平均不到 5% 的会话会触发。

升级版安全分类器

新分类器在保持 92% 以上良性提示通过率的同时，官方测试数据中可消除 95% 的危害向量，较此前 60% 的水平大幅提升。AI 安全研究所（AISI）独立评估后认为其已具备足够的鲁棒性。

Mythos 5 + Project Glasswing

Mythos 5 与 Fable 5 底层相同但移除安全护栏，仅通过 Project Glasswing 合作计划向少数网络防御组织和基础设施提供商提供。Anthropic 将与美国政府合作部署。

实际应用案例

Stripe：一天内完成传统方式两个月的工作量（首次因"能力过强"触发内部安全警报）
Evozyne 药物设计：新蛋白设计速度提高 10 倍

Claude Fable 5 是 Anthropic 迄今为止最激进的模型发布。Mythos 级别能力通过"安全分类器"降级机制对外提供通用访问，同时将无限制版本限定于网络防御场景——这种"能力分级"策略代表了前沿 AI 部署的新范式。Stripe 一天完成两月工作量和 Evozyne 药物设计提速 10 倍的实际案例，说明 AI 在企业级编程和药物研发中的能力正在快速逼近"替代级"。

当前 DeepSeek V4 Pro、GPT-5.5 和 Claude Fable 5 在编程能力上已形成三足鼎立，但 Fable 5 在整体 benchmark 上的全面领先表明 Anthropic 在 Mythos 级别建立了显著优势。

后续值得跟踪的方向：

Guard Classifiers 的实际表现：5% 触发率在真实生产场景中的可接受度
Project Glasswing 的扩展：Mythos 5 的访问范围是否会扩大？
出口管制影响：美国政府出口管制对 Claude 系列模型全球访问的实际影响

用户评价

加载评价中...