Anthropic 发布 Claude Fable 5 与 Mythos 5——迄今最强模型,带安全护栏的 Mythos 级别
Anthropic 推出 Mythos 级别模型 Fable 5(通用版带安全护栏)和 Mythos 5(网络防御版)。Stripe 一天完成两月工作量,药物设计提速 10 倍,定价 $10/$50 每百万 token。
Anthropic 发布 Claude Fable 5 与 Mythos 5:迄今最强模型步入 Mythos 时代
⚠️ 更新:Anthropic 于 2026年6月12日宣布,应美国政府出口管制指令要求,暂停 Claude Fable 5 和 Claude Mythos 5 的所有访问权限。官方表示正在尽快恢复服务。
Anthropic 宣布推出 Claude Fable 5——一款 Mythos 级别的模型,已通过安全护栏改造适用于广泛使用。Fable 5 的能力超越了该公司此前公开发布的任何模型,在软件工程、知识工作、视觉识别、科学研究等多个领域均达到业界领先水平,任务越复杂、周期越长,领先优势越明显。
发布如此强大的模型伴随着风险。如果没有安全防护措施,Fable 5 在网络安全等领域的能力可能被恶意利用,造成严重危害。因此,Anthropic 为该模型配备了安全护栏:在某些主题上的查询将由次强模型 Claude Opus 4.8 代为响应。为确保在安全的前提下尽快发布,这些安全护栏采用了保守配置——有时会拦截无害的请求,但平均仅在不到 5% 的会话中触发。
面向一小群网络防御者和基础设施提供商,Anthropic 同时发布了 Claude Mythos 5。该模型与 Fable 5 基于相同的底层模型,但在部分领域移除了安全限制。Mythos 5 将首先通过 Project Glasswing 部署,与美国政府合作推进。
定价:输入 token 每百万 $10,输出 token 每百万 $50——不到 Claude Mythos Preview 价格的一半。
能力评估
软件工程
据 Stripe 反馈,Fable 5 将数月工程压缩至数天。在一个 5000 万行 Ruby 代码库中,该模型一天内完成了一次全代码库迁移,而同样的工作如果由人工团队完成需要两个多月。在 Cognition 的 FrontierCode 评估中,Fable 5 即使在中努力度设置下也在所有前沿模型中得分最高。
知识工作
在 Hebbia 面向高级推理能力的金融基准测试中,Fable 5 取得所有模型中的最高分,在文档推理、图表解读和问题解决方面均有显著提升。IMC 指出,Fable 5 在其交易分析评估中几乎全面满分。
视觉能力
Fable 5 在视觉任务上达到新的业界最佳水平。该模型能从详细科学图表中提取精确数字,仅凭截图就能重建 Web 应用的源代码。在 Pokémon FireRed 游戏中,Fable 5 仅使用视觉信号就完成了通关——而之前的 Claude 模型需要复杂的辅助工具。
记忆与长上下文
Fable 5 能够在数百万 token 的长时间运行任务中保持专注。在 Slay the Spire 游戏中,持久化文件式记忆使 Fable 5 的表现提升幅度是 Opus 4.8 的三倍;该模型到达游戏最终关卡的概率也提高了三倍。
药物设计
使用 Mythos 5,Anthropic 内部蛋白质设计专家将药物设计流程的多个环节加速了约 10 倍。Mythos 5 在蛋白质设计工具辅助下(无需人工干预),能力达到甚至超越熟练的人类操作者。在 14 个蛋白质靶点中,有 9 个产生了有望用于药物设计的候选方案。
分子生物学新假说
Mythos 5 是首个能够持续产生新颖、可信科学假说的模型。在盲测对比中,科学家们约 80% 的情况下更倾向于 Mythos 的分子生物学假说。其中一个假说——关于大肠杆菌蛋白的新机制——已被独立实验室的研究论文所证实。
基因组学原创研究
Mythos 5 在一周多的时间里自主完成了新颖的基因组学研究。该模型组装了横跨 138 个动物物种的数百万个细胞的单细胞数据,并设计训练了一个定制机器学习模型。在仅接受高层次人工指导的情况下,其训练出的模型以 100 分之一的规模超越了近期发表在《Science》期刊上的模型。相关结果计划在未来数月内发表。
Fable 5 的安全防护
Mythos 级别模型对恶意行为者构成了实质性的能力提升风险。Fable 5 配备了安全分类器系统——独立的 AI 系统用于检测潜在的滥用行为。当分类器触发时,请求将由 Claude Opus 4.8 代为处理。超过 95% 的 Fable 5 会话无需回退。
涵盖三大领域:
- 网络安全:防止漏洞利用和自动化黑客攻击。外部测试发现 Fable 5 的安全防护是所有测试模型中最强的——零有害请求被成功执行。
-
生物学与化学:阻止高风险生物研究查询。Mythos 5 展示了预测病毒外壳蛋白特性的能力,超越了专用蛋白质语言模型——凸显了双重用途风险。
-
蒸馏保护:阻止在威权国家大规模提取模型能力以训练竞品模型的行为。
可用性与定价
- Fable 5:即日上线,$10/$50 每百万 token
- Mythos 5:仅限 Glasswing 合作伙伴
- 订阅计划:6月22日前免费包含,之后需使用积分
- API 名称:
claude-fable-5
Fable 5 和 Mythos 5 的发布标志着 AI 行业进入了一个新阶段。Anthropic 确立了清晰的模型分层体系——Haiku → Sonnet → Opus → Mythos/Fable——Mythos 作为 Opus 之上的新层级,意味着 AI 能力已跨越关键阈值,足以在网络安全和生物学研究等高风险领域产生实质性能力提升。
发布仅三天后,美国政府即发布出口管制指令暂停访问。这是美国政府首次直接干预一款 AI 模型的公开可用性,标志着前沿 AI 模型已成为地缘政治筹码。对于中国 AI 行业而言,这意味着 Mythos 级别及以上的模型可能面临持续性的出口限制,国产大模型在能力上限上的追赶压力将进一步加大。
Fable 5 的实测数据令人印象深刻:Stripe 一天完成两个月工作量、药物设计流程提速 10 倍、以 1/100 模型规模超越《Science》论文——这些不是增量改进,而是能力层级的跃迁。Anthropic 同时展示了"能力"和"安全"的双重创新:安全分类器系统可能成为未来前沿模型的标准配置,而非可选项。
后续值得持续跟踪的关键方向:
- Fable 5 何时恢复访问——出口管制的具体条件和时间线
- Mythos 5 可信访问计划的生物研究申请通道进展
- OpenAI/Google 如何应对 Mythos 级别的能力标准
- 安全分类器误报率的后续优化数据
- 中国市场的可用性——出口管制对国内 Claude 用户的实际影响
参考:
用户评价