重磅！Anthropic发布世界最强和最危险的“神话”级大模型

发布者：资三四郎 2026-6-10 10:09

2026年6月9日，AnthroAnthropicpic做了一件以前从没做过的事。

它把旗下保密等级最高的"Mythos级"模型，以一个经过安全处理的版本，正式对普通公众开放了。这个版本叫做Claude Fable 5，比Claude Opus家族整个高出一个层级。

在此之前，Mythos模型只向极少数经过审查的网络安全和生物研究合作伙伴开放。2026年4月，Anthropic正式发布Claude Mythos时，其强悍的漏洞挖掘能力引发了业界广泛担忧，公司随即宣布"封印"该模型，不向公众开放。直到6月初，Anthropic才逐步将Mythos访问权限扩展至15个国家的关键基础设施机构，而完全面向大众的版本，就是现在这个Fable 5。

名字颇有深意。Anthropic解释，"Fable"来自拉丁语fabula，意为"所讲述的故事"，而Mythos同样来自希腊语中相近的词根，两者本质上是同一个模型的两面，区别只在于安全层的厚度。

一个真实的性能跳跃

如果你已经习惯了AI基准测试每次只前进零点几个百分点，Fable 5会给你一种久违的感觉。

在编程能力测试SWE-Bench Pro上，Fable 5拿到了80.3%的成绩，而排名第二的模型得分比它低了整整11个百分点，GPT-5.5在同一测试中得分为58.6%。空间推理能力相比上一代Opus 4.8近乎三倍增长，从14.5%跳升至38.6%。法律推理能力同样出现了大幅提升，达到13.3%，而GPT-5.5在这一项上只有2.1%，Gemini则是0.0%。

当然，跑分永远是跑分。真正有说服力的是现实世界里的案例。支付基础设施公司Stripe在一个拥有5000万行Ruby代码的超大型代码库上测试了Fable 5，完成一次全库迁移的时间是一天，而Stripe此前估计这个任务需要一支完整工程团队忙上两个月以上。数据分析平台Hex报告称，Fable 5是首个在其核心分析基准测试上突破90%的模型，测试内容是复杂的、长时间运行的分析任务。AI编程工具研究者Andrej Karpathy在发布当天给出了这样的评价："基准测试已经很出色，各项都领先，但我还要补充，从质感上看，这是一个值得升一个大版本号的跨越式进步。"他特别指出，这种提升在"长时间、高难度问题求解"场景中尤为明显。

它有多少功能是被"锁起来"的

这里有一个所有开发者必须搞清楚的机制，否则上线之后会被搞糊涂。

Fable 5内置了专门针对网络安全、生物化学以及模型蒸馏等领域的内容分类器。一旦某个请求触发了这些分类器，系统会自动将请求切换给Claude Opus 4.8来处理，并向用户明确告知这一情况。Anthropic表示，早期数据显示，至少有95%的Fable 5会话完全在模型自身的能力范围内运行，触发回退的情况不足5%。

也就是说，那些让Mythos备受担忧的危险能力，在Fable 5这里被切断了。被广泛引用的高危漏洞挖掘、生化合成路径分析等能力，在测试结果中使用的是Mythos 5的数据，Fable 5在那些具体任务上的实际表现更接近Opus 4.8。发布前，Anthropic邀请外部安全团队进行了超过1000小时的红队测试，没有发现通用越狱方法，但公司承认新型攻击路径依然可能存在，因此要求所有Mythos级流量必须保留30天数据，即使此前签有零保留协议的企业客户也不例外。这一政策本身可能成为行业先例，高性能模型的访问权将与强制数据保留政策捆绑在一起。

值得注意的还有定价。Fable 5的价格是每百万输入token 10美元、每百万输出token 50美元，大约是Opus 4.8的两倍。在企业界普遍开始审查AI成本、不少团队已经提前用完全年AI预算的当下，这个价格并不轻松。Anthropic的设计思路很清晰：把Fable 5留给那些真正值得用它的任务，比如大规模代码迁移、多天的自主代理工作流、深度研究，而不是所有请求一刀切。

一个更大的背景

Fable 5的发布时机耐人寻味。就在同一周，Anthropic正准备进行IPO，OpenAI也在紧随其后递交了保密版招股书。与此同时，Anthropic研究院刚刚发布了一份措辞严肃的声明，呼吁全球主要AI实验室共同建立"紧急制动机制"，警告AI系统正在以如此之快的速度进化，可能很快就会实现递归自我改进，即模型在无人干预的情况下自动提升自身能力。

一方面在警告速度太快，另一方面又把最强模型推向了大众，这个矛盾本身就是当前整个AI行业处境的缩影。Anthropic的逻辑是：既然Mythos级能力迟早会扩散，不如由自己来控制扩散的方式，带着锁出去，总好过让它无管制地出去。

这套逻辑是否成立，只有时间才能给出答案。但有一件事是确定的：2026年6月9日起，普通用户第一次可以调用一个Mythos级模型，哪怕它的某些房间门依然关着。

上一篇：“史上最贵世界杯”，到底有多赚钱？一文了解

下一篇：湖北暴赚85%靠运气？别酸了，人家苦熬五十年！