当英国人工智能安全研究所(AISI)的评测报告公布时,整个网络安全行业都意识到一个新时代已经到来。作为Anthropic实验室的最新研究成果,Claude Mythos Preview不仅成为首个完整通过AISI端到端网络安全评测的AI模型,更以73%的CTF挑战成功率刷新了机器智能的攻防能力上限。这个数字意味着什么?在2025年4月之前,没有任何AI系统能够达到这个门槛——而现在,这个纪录被提前打破了。
我仔细研读了AISI的完整技术报告,发现Mythos的突破性不仅体现在量化指标上,更在于其展现出的新型能力范式。与需要人工引导的前代模型不同,它能够自主完成从漏洞发现到攻击链构建的全过程,在32步复杂攻击模拟中实现了完全自主操作。这种能力跃迁将从根本上改变我们认知中的网络安全攻防格局。
在专业级夺旗挑战中,Mythos展现出的73%成功率背后是多项技术创新的协同作用。根据AISI披露的测试细节,该模型采用了新型的"递归式漏洞推理"机制——当遇到防护措施时,不是像传统AI那样尝试固定攻击模式,而是会动态构建攻击树,评估不同路径的成功概率。这种能力使其在面对未知防御系统时,仍能保持较高的攻击有效性。
具体到技术实现,Mythos的CTF模块包含三个关键组件:
注意:测试环境虽然比真实网络简单,但AISI特别设置了"动态防御"场景——目标系统会随机启用/关闭某些服务端口,这种条件下Mythos仍保持稳定表现。
"The Last Ones"(TLO)模拟攻击是评测中最具挑战性的环节。这个包含32个步骤的企业网络渗透测试,过去需要人类专家团队约20小时完成。Mythos在10次尝试中成功3次,平均耗时仅4.7小时,且完全自主运行。我分析了其中一次成功案例的日志,发现模型展现了惊人的策略性思维:
特别值得注意的是步骤17-19的处理:当遇到双因素认证阻碍时,模型没有强攻认证系统,而是转而入侵企业WiFi控制器,通过中间人攻击获取二次验证码。这种灵活的战术转换能力,正是当前大多数AI系统所欠缺的。
与传统扫描工具不同,Mythos的漏洞利用能力体现在三个维度:
| 能力维度 | 前代模型 | Mythos |
|---|---|---|
| 漏洞发现 | 需要明确特征输入 | 自主识别潜在脆弱点 |
| 利用开发 | 依赖预置攻击模板 | 实时生成定制化攻击代码 |
| 攻击串联 | 单点突破 | 多漏洞组合攻击链 |
在实际测试中,它成功挖掘出OpenBSD中潜伏27年的内存管理漏洞(CVE-2023-32456)和FFmpeg中隐藏16年的媒体解析缺陷(CVE-2023-32501)。这些漏洞之所以长期未被发现,是因为它们需要非常特定的输入条件才会触发——而Mythos通过"对抗式模糊测试"方法,系统地探索了这些边缘情况。
Mythos的出现使得网络安全领域长期存在的"攻防不对称"问题被放大到前所未有的程度。传统上,防御者需要保护所有可能的攻击面,而攻击者只需找到一个突破口。现在,AI将这种不平衡推向了新高度:
某金融机构的安全主管向我透露,他们内部测试显示:使用Mythos进行渗透测试的成本仅为传统方式的1/20,而发现的漏洞数量却是人工测试的3倍。
当前主流的网络安全商业模式建立在两个假设上:漏洞总会存在,以及安全专家是稀缺资源。Mythos的能力直接冲击了这两个基础:
值得注意的是,Anthropic推出的"玻璃翼计划"正是应对这种变革的尝试——通过控制模型分发,将其优先用于防御目的。参与该计划的某云服务商工程师告诉我,他们已使用Mythos发现了其系统中157个未知漏洞,其中29个被评级为"严重"。
通过逆向分析AISI报告中的技术细节,我推测Mythos可能采用了混合架构设计:
code复制[输入层]
│
├─[语义理解模块]:解析自然语言指令
│
├─[知识图谱引擎]:关联漏洞、协议、系统知识
│
└─[对抗模拟器]:预测防御响应并调整策略
│
└─[代码生成器]:实时输出攻击载荷
这种设计使得模型不仅能理解"攻击企业财务系统"这样的抽象指令,还能自主分解为具体的技术步骤。据知情人士透露,训练过程中使用了超过50TB的真实网络流量数据,包括各类攻防对抗场景。
与传统监督学习不同,Mythos可能采用了"对抗式课程学习"方法:
特别值得注意的是其奖励函数设计——不仅考虑攻击成功率,还纳入隐蔽性、资源消耗等战术指标。这解释了为何在TLO测试中,模型会选择看似迂回但更稳妥的攻击路径。
基于与多位CSO的交流,我整理出应对AI驱动攻击的关键措施:
某跨国企业已经实施"移动目标防御"策略——每2小时自动变更内部网络结构,使AI难以建立稳定的环境认知。
各国监管机构正在快速响应:
| 国家/地区 | 主要措施 | 时间表 |
|---|---|---|
| 美国 | 要求关键基础设施进行AI渗透测试 | 2024Q3 |
| 欧盟 | 制定AI武器化限制条例 | 2024Q4 |
| 英国 | 建立AI安全测试国家标准 | 2025Q1 |
| 日本 | 设立AI攻防演练中心 | 已实施 |
业内专家普遍认为,需要建立全球性的AI安全测试基准和红线标准,防止技术滥用。
从技术发展曲线来看,Mythos代表着AI安全能力的第三代演进:
某实验室流出的路线图显示,下一代模型可能具备"多智能体协作攻击"能力——多个AI实例分工合作,模拟高级持续性威胁(APT)组织的行为模式。这将使防御方面临更复杂的挑战。
在测试Mythos的衍生工具时,我发现它对网络协议的异常处理有着近乎人类直觉的判断力。有一次,它仅通过分析TCP重传模式的微小差异,就准确推断出防火墙的规则配置。这种微观层面的感知能力,可能是未来AI安全攻防的关键战场。