Anthropic 发布 Claude Fable 5:首款带安全护栏的 Mythos 级通用模型
Anthropic 发布 Mythos 级模型 Claude Fable 5(通用版带安全护栏)和 Mythos 5(网络防御无人限制版)。定价 $10/$50/百万 token,Stripe 一天完成两月工作量,Evozyne 药物设计提速 10 倍。
Anthropic 发布 Claude Fable 5:首款带安全护栏的 Mythos 级通用模型
Anthropic 正式发布迄今为止最强的 Claude 模型:Claude Fable 5 是首款面向通用用户开放的 Mythos 级模型(带安全护栏),在软件工程、知识工作、视觉、科学研究等领域几乎所有测试基准上均达到 SOTA,任务越复杂、耗时越长,领先优势越明显。Claude Mythos 5 为移除安全护栏的版本,仅通过 Project Glasswing 向网络防御组织定向开放。同步推出升级版安全分类器,据官方测试消除 95% 危害向量。定价 $10/$50 每百万 token。
在线评估(Chatbot Arena):Fable 5 在所有类别中排名第一,领先第二名 70 ELO——相当于从 GPT-5.4 到 GPT-5.5 的差距。胜率极高达 86%,平局和对战决胜率 96%。编程能力 ELO 达 1794,编码风格任务 96.8 分。
定价:输入 $10/百万 token,输出 $50/百万 token。
安全护栏设计
Mythos 级别模型的能力伴随着风险——Fable 5 在网络安全等领域的能力可能被恶意利用。因此 Anthropic 为 Fable 5 部署了保护性分类器(Guard Classifiers),对于某些类别的查询将转由 Claude Opus 4.8 处理。这些安全护栏被调校得较为保守——平均不到 5% 的会话会触发。
升级版安全分类器
新分类器在保持 92% 以上良性提示通过率的同时,官方测试数据中可消除 95% 的危害向量,较此前 60% 的水平大幅提升。AI 安全研究所(AISI)独立评估后认为其已具备足够的鲁棒性。
Mythos 5 + Project Glasswing
Mythos 5 与 Fable 5 底层相同但移除安全护栏,仅通过 Project Glasswing 合作计划向少数网络防御组织和基础设施提供商提供。Anthropic 将与美国政府合作部署。
实际应用案例
- Stripe:一天内完成传统方式两个月的工作量(首次因"能力过强"触发内部安全警报)
- Evozyne 药物设计:新蛋白设计速度提高 10 倍
Claude Fable 5 是 Anthropic 迄今为止最激进的模型发布。Mythos 级别能力通过"安全分类器"降级机制对外提供通用访问,同时将无限制版本限定于网络防御场景——这种"能力分级"策略代表了前沿 AI 部署的新范式。Stripe 一天完成两月工作量和 Evozyne 药物设计提速 10 倍的实际案例,说明 AI 在企业级编程和药物研发中的能力正在快速逼近"替代级"。
当前
DeepSeek V4 Pro、GPT-5.5 和 Claude Fable 5 在编程能力上已形成三足鼎立,但 Fable 5 在整体 benchmark 上的全面领先表明 Anthropic 在 Mythos 级别建立了显著优势。
后续值得跟踪的方向:
- Guard Classifiers 的实际表现:5% 触发率在真实生产场景中的可接受度
- Project Glasswing 的扩展:Mythos 5 的访问范围是否会扩大?
- 出口管制影响:美国政府出口管制对 Claude 系列模型全球访问的实际影响
用户评价