重磅!Anthropic发布世界最强和最危险的“神话”级大模型

发布者:资三四郎 2026-6-10 10:09

2026年6月9日,AnthroAnthropicpic做了一件以前从没做过的事。

它把旗下保密等级最高的"Mythos级"模型,以一个经过安全处理的版本,正式对普通公众开放了。这个版本叫做Claude Fable 5,比Claude Opus家族整个高出一个层级。

在此之前,Mythos模型只向极少数经过审查的网络安全和生物研究合作伙伴开放。2026年4月,Anthropic正式发布Claude Mythos时,其强悍的漏洞挖掘能力引发了业界广泛担忧,公司随即宣布"封印"该模型,不向公众开放。直到6月初,Anthropic才逐步将Mythos访问权限扩展至15个国家的关键基础设施机构,而完全面向大众的版本,就是现在这个Fable 5。

名字颇有深意。Anthropic解释,"Fable"来自拉丁语fabula,意为"所讲述的故事",而Mythos同样来自希腊语中相近的词根,两者本质上是同一个模型的两面,区别只在于安全层的厚度。

一个真实的性能跳跃

如果你已经习惯了AI基准测试每次只前进零点几个百分点,Fable 5会给你一种久违的感觉。

在编程能力测试SWE-Bench Pro上,Fable 5拿到了80.3%的成绩,而排名第二的模型得分比它低了整整11个百分点,GPT-5.5在同一测试中得分为58.6%。空间推理能力相比上一代Opus 4.8近乎三倍增长,从14.5%跳升至38.6%。法律推理能力同样出现了大幅提升,达到13.3%,而GPT-5.5在这一项上只有2.1%,Gemini则是0.0%。

当然,跑分永远是跑分。真正有说服力的是现实世界里的案例。支付基础设施公司Stripe在一个拥有5000万行Ruby代码的超大型代码库上测试了Fable 5,完成一次全库迁移的时间是一天,而Stripe此前估计这个任务需要一支完整工程团队忙上两个月以上。数据分析平台Hex报告称,Fable 5是首个在其核心分析基准测试上突破90%的模型,测试内容是复杂的、长时间运行的分析任务。AI编程工具研究者Andrej Karpathy在发布当天给出了这样的评价:"基准测试已经很出色,各项都领先,但我还要补充,从质感上看,这是一个值得升一个大版本号的跨越式进步。"他特别指出,这种提升在"长时间、高难度问题求解"场景中尤为明显。

它有多少功能是被"锁起来"的

这里有一个所有开发者必须搞清楚的机制,否则上线之后会被搞糊涂。

Fable 5内置了专门针对网络安全、生物化学以及模型蒸馏等领域的内容分类器。一旦某个请求触发了这些分类器,系统会自动将请求切换给Claude Opus 4.8来处理,并向用户明确告知这一情况。Anthropic表示,早期数据显示,至少有95%的Fable 5会话完全在模型自身的能力范围内运行,触发回退的情况不足5%。

也就是说,那些让Mythos备受担忧的危险能力,在Fable 5这里被切断了。被广泛引用的高危漏洞挖掘、生化合成路径分析等能力,在测试结果中使用的是Mythos 5的数据,Fable 5在那些具体任务上的实际表现更接近Opus 4.8。发布前,Anthropic邀请外部安全团队进行了超过1000小时的红队测试,没有发现通用越狱方法,但公司承认新型攻击路径依然可能存在,因此要求所有Mythos级流量必须保留30天数据,即使此前签有零保留协议的企业客户也不例外。这一政策本身可能成为行业先例,高性能模型的访问权将与强制数据保留政策捆绑在一起。

值得注意的还有定价。Fable 5的价格是每百万输入token 10美元、每百万输出token 50美元,大约是Opus 4.8的两倍。在企业界普遍开始审查AI成本、不少团队已经提前用完全年AI预算的当下,这个价格并不轻松。Anthropic的设计思路很清晰:把Fable 5留给那些真正值得用它的任务,比如大规模代码迁移、多天的自主代理工作流、深度研究,而不是所有请求一刀切。

一个更大的背景

Fable 5的发布时机耐人寻味。就在同一周,Anthropic正准备进行IPO,OpenAI也在紧随其后递交了保密版招股书。与此同时,Anthropic研究院刚刚发布了一份措辞严肃的声明,呼吁全球主要AI实验室共同建立"紧急制动机制",警告AI系统正在以如此之快的速度进化,可能很快就会实现递归自我改进,即模型在无人干预的情况下自动提升自身能力。

一方面在警告速度太快,另一方面又把最强模型推向了大众,这个矛盾本身就是当前整个AI行业处境的缩影。Anthropic的逻辑是:既然Mythos级能力迟早会扩散,不如由自己来控制扩散的方式,带着锁出去,总好过让它无管制地出去。

这套逻辑是否成立,只有时间才能给出答案。但有一件事是确定的:2026年6月9日起,普通用户第一次可以调用一个Mythos级模型,哪怕它的某些房间门依然关着。

大家都在看

相关文章