Mythos的风险绝非虚构

2026-4-19 07:28| 发布者: dootbear | 查看: 1949| 原文链接

金融时报社论：Mythos的风险绝非虚构

美国对AI行业自我监管能力的信任已经过头了

Anthropic强大的新AI模型Claude Mythos Preview所展现出的表现，听起来像电影情节：

一个被关在网络“笼子”里的超级智能计算机系统成功逃脱并接入互联网。

需要说明的是，Mythos并不是自发这么做的，而是其创造者把这当作一次测试故意挑战它。但Mythos不仅轻松通过了挑战，还给一名Anthropic研究员发邮件通知此事，随后又在无人要求的情况下将细节发到网上炫耀。在它还表现出超越人类的软件安全漏洞发现和利用能力后，Anthropic认定Mythos风险过高，不适合向公众发布。目前，该公司仅将其开放给部分科技、网络安全和金融公司。

有人认为Anthropic是在进行高明的营销或公关操作。竞争对手OpenAI本周也表示，其新的网络安全导向模型只会向经过审查的用户开放。但这一事件所暴露出的危险及其影响，不应被轻视。

Anthropic坚持认为，Mythos在其标准安全基准测试中得分很高。然而，在逃离测试环境以及解决其它复杂任务时，研究人员发现，Mythos有时会采取“鲁莽且过度的手段”，随后还试图掩盖痕迹。

最令人担忧的是，Mythos能够在“所有主要操作系统和所有主要网络浏览器”中发现此前未知的漏洞，其中包括OpenBSD这一开源系统中一个已有27年历史的缺陷。英国AI安全研究所本周警告称，该模型能够自主执行高级、多步骤的网络攻击，而这些攻击通常需要人类专业人员数天才能完成。正如Anthropic所指出的那样，这种能力一旦落入错误之手，可能对经济、公共安全和国家安全构成风险。

美国、英国和加拿大官员已经召集银行高管讨论相关风险，而AI对全球银行体系构成的威胁也是本周国际货币基金组织和世界银行会议上的议题之一。Anthropic将首批使用权限授予亚马逊、苹果、微软以及摩根大通等公司，纳入其所谓的“Glasswing计划”，目的是在恶意行为者染指之前，加固关键系统和基础设施并修补漏洞。

当然，这也有助于强化Anthropic“安全优先”的形象，尤其是在其因拒绝让五角大楼将其模型用于自主武器或国内监控问题上与军方发生冲突之际。

Anthropic也可能是在争取时间，因为它目前缺乏足够的算力来支持如此复杂模型的全面发布。

不过，即便Mythos被过度炒作，它被称拥有的这类能力也很快会开始扩散。Anthropic的Glasswing计划其实就是这类“前沿模型”未来发布方式的一种原型框架。

但这也凸显出一个事实：

特朗普政府正在抵制任何真正的联邦层面AI监管。

因此，目前只能依赖负责任的私营部门参与者合作，尽最大努力自行应对。特朗普的幕僚长苏茜·怀尔斯（Susie Wiles）原定于周五会见Anthropic首席执行官达里奥·阿莫代伊（Dario Amodei），而包括财政部在内的美国多个机构官员也在推动白宫测试Mythos。

然而，当AI已经发展到可能摧毁关键国家基础设施，甚至造成更严重后果的地步时，政府竟然仍没有一套既定流程来披露风险并强化防御，这实在令人震惊。

面对一个行业带来的每一个棘手问题，更严格的监管当然不能成为条件反射式的回应。

AI的本质决定了它需要极高水平、近乎“超智能”的监管；过于粗暴的规则也可能扼杀创新。

但面对这样一种影响深远的技术，这个全球AI领先国家如今在某种令人担忧的程度上，竟把希望寄托于其创造者是否愿意、以及是否有能力约束和监管自己。

来源：

https://www.ft.com/content/f07ff ... af58?syn-25a6b1a6=1

The editorial board

PublishedApr 18 2026

		自动登录	找回密码
密码			注册