Firefox 和 Anthropico:它们如何利用人工智能来寻找浏览器漏洞

  • Anthropic 公司的 Claude Opus 4.6 在短短两周内就检测到 Firefox 中存在 22 个漏洞,其中 14 个是高危漏洞。
  • AI 分析了数千个 C++ 文件和 JavaScript 引擎,生成了 100 多份包含可复现的最小测试用例的报告。
  • Mozilla 修复了 Firefox 148 中的所有安全漏洞,并计划将 AI 辅助分析集成到其常规工作流程中。
  • 该案例表明,人工智能可以加强欧洲乃至全球的软件安全,但如果被用于攻击目的,也会带来风险。

Firefox 和 Anthropico AI 将用于检测漏洞

的闯入 人工智能作为网络安全工具 Mozilla 与 Anthropic 在 Firefox 浏览器开发方面取得了重大突破。短短几周内,人工智能模型就发现了 Mozilla 开源浏览器中的多个漏洞,而这些漏洞通常需要数月的人工才能发现。

这项实验对……产生了直接影响 西班牙和欧洲其他地区的Firefox用户它用于衡量语言模型在审计真实代码方面如今能发挥多大的作用,以及它们在保护数亿人每天使用的软件方面能发挥什么作用。

当人工智能成为最佳安全审计员

在软件安全领域,在攻击者之前发现漏洞至关重要:这可能意味着截然不同的结果。 保护数百万用户还是暴露他们的数据在这种情况下,Mozilla 测试了一种不同寻常的方法:让先进的人工智能审查其浏览器的源代码,以便在研究人员或网络犯罪分子之前发现漏洞。

在发布会开始前几周 火狐148浏览器安全团队收到了一份令人震惊的报告: 人类前沿红队 该公司内部的进攻研究小组声称,借助其克劳德模型,他们发现: 十几个可验证的安全漏洞 在Firefox的JavaScript引擎中。这些并非仅仅是怀疑,而是有确凿证据支持的漏洞。

它与其他在该领域使用人工智能的尝试相比,最大的区别在于报告的质量。每个漏洞都有相应的佐证。 最小可复现测试用例这些代码片段很小,却能确定性地触发漏洞。这使得 Mozilla 的工程师能够在数小时内验证问题是否真的存在,并立即着手修复,而无需花费时间重现那些难以捉摸的场景。

在一个生态系统中,许多由自动化工具生成的警报最终都被丢弃,因为它们是 误报或不准确报告Anthropic 的方法大幅降低了噪音,并提供了有用的信号:数量较少,但结果经过验证且可操作。

Firefox 中的 AI 安全审计

Anthropic 的 Frontier Red Team 是什么?它如何与 Claude 合作?

电话 前线红队 这是Anthropic公司专门探索其人工智能模型在攻防安全领域极限的部门。其目标不仅在于评估模型内部的风险,还在于调查…… 如何利用人工智能发现实际软件中的漏洞? 在恶意行为者采取行动之前。

近几个月来,该团队已经证明,像这样的模型 克劳德作品 4.6 可以运行 在受控环境下对复杂网络进行多阶段攻击这体现了他们的分析能力。同样的能力已被以协调负责的方式重新分配,用于按照负责任的漏洞披露流程审查 Firefox 等开源项目。

以 Mozilla 浏览器为例,Anthropic 首先进行了一项测试练习:使用 Claude 来 重现历史上的 Firefox 漏洞(CVE)我们检查了该模型是否能够识别旧版本代码中已记录的故障模式。结果显示模型能够识别,但需要注意一点:部分信息可能已存在于模型的训练数据中。

为了更进一步,Frontier Red Team 迈出了关键一步:让 AI 定位 当前版本的Firefox存在新的漏洞。也就是说,这些漏洞尚未被列入任何公共数据库或 Mozilla 的内部跟踪系统中。

Firefox JavaScript 引擎漏洞是如何被发现的

起点是浏览器的 JavaScript 引擎,这是一个关键组件,因为它负责…… 从网页执行不受信任的外部代码这一层的任何错误,在最坏的情况下,都可能成为攻击用户系统的入口。

正如 Anthropico 和 Mozilla 所解释的那样, 克劳德在大约二十分钟后发现了自己的第一个致命弱点。 从分析一开始,这就是一种类型的失败。 释放后使用,这是一种内存漏洞,如果与其他系统弱点结合使用,攻击者可以利用这种漏洞用任意内容覆盖数据。

在 Anthropico 的工程师使用最新浏览器版本的虚拟机验证这一初始警报的同时,人工智能仍在并行运行。在此期间,该模型已经发出警报。 大约有 50 个额外的输入数据存在异常行为其中许多后来变成了测试用例,并发送给了 Mozilla。

这个过程并不局限于 JavaScript 引擎。在大约两周的时间里,克劳德分析了…… 近 6.000 个 C++ 文件和数千个其他项目文件共生成 112 份独立报告。经 Mozilla 安全团队初步筛选后,确认了以下报告。 已注册为 CVE 的 22 个漏洞, 其中 14例被归类为高危病例此外,还有近 90 起影响较小或仅仅是逻辑错误的故障。

所有已发现的安全问题均已在 Firefox 148 开发周期中修复。此版本现已面向欧洲及世界其他地区的用户开放。优先级较低的错误也已修复,但部分调整将保留至后续版本,以避免在单个版本中引入过多更改。

Mozilla 人类学安全合作

检测到超过100个漏洞,误报率低于其他人工智能系统。

在整个合作过程中,克劳德的分析得出了以下结论: 超过100个不同的火狐浏览器漏洞虽然并非所有漏洞都被证实是可利用的漏洞,但其数量表明,即使是像 Mozilla 浏览器这样成熟且经过审计的项目,仍然可能隐藏大量漏洞。

为了让大家了解其影响,Mozilla 的安全团队解释说,仅仅在这两周的测试中,人工智能就能够…… 找出相当于一年内浏览器中所有已修复关键漏洞总数的约 20% 的高危漏洞数量。换句话说,人工智能辅助审计将通常需要几个月才能完成的任务压缩到了几天之内。

误报率是关键因素之一。近年来,许多开源项目,包括欧洲的项目,都出现了误报。 低质量人工智能工具生成的海量报告这些报告通常由希望通过漏洞赏金计划获得奖励的用户提交。他们提交的报告要么是不存在的问题,要么是描述不清的问题,给维护人员造成了很大的压力。

Mozilla 意识到这种情况,最初对合作持谨慎态度。然而,Frontier Red Team 的做法却截然不同: 只有附有确凿证据的裁决才会提交复审。,能够清晰地自动复制,并且在某些情况下,人工智能会自行生成候选补丁建议,并由人类进行审核。

Mozilla 的工程师们强调了他们认为信任基于人工智能的报告所必需的三个要素: 最小测试用例、详细的概念验证和建议的补丁这种组合大大缩短了确认一项发现是否需要立即处理或可以推迟处理所需的时间。

人工智能能否利用它发现的漏洞?

实验中最棘手的问题之一是,要弄清楚克劳德是否不仅能够…… 寻找漏洞但也要将它们变成 功能性漏洞利用也就是说,攻击能够对目标系统执行恶意操作。

Anthropic 决定在受控环境下测试该模型的这项能力。团队向模型提供了已向 Mozilla 报告的漏洞信息,并要求其生成利用代码,目的是…… 读写本地文件 在测试机上执行的操作,在实际场景中会导致系统严重受损。

为了实现这一目标,进行了数百次单独的执行,并投入了约[金额缺失]。 价值 4.000 美元的 API 积分结果很微妙:克劳德最终只完成了 两个简单的漏洞利用方法即可奏效然而,这种情况只发生在现代浏览器中存在的几项保护措施(例如沙盒和其他强化防御措施)被故意禁用的环境中。

Mozilla强调,在实际情况下,攻破Firefox通常需要 将多个漏洞串联起来,绕过多层防御即使发现一个高危漏洞,也很少足以控制用户的系统,这目前限制了这些工具的直接攻击潜力。

即便如此,Anthropic 认为,语言模型能够做到这一点意义重大,即使只是在少数情况下,并且在简化的条件下。 自动生成针对现代浏览器的漏洞利用程序该公司警告称,随着评估模型和方法的不断改进,这种差距(即发现漏洞和利用漏洞之间的差距)可能会缩小。

Mozilla 将人工智能集成到其安全协议中

合作取得成功之后, Mozilla 已确认将把人工智能辅助分析整合到其常规安全工作流程中。 适用于 Firefox 浏览器。该基金会的团队已经开始在内部使用 Claude 对代码的关键区域进行错误分类、补丁审查和漏洞模式检测。

该组织在欧洲拥有强大的用户和开发者群体,并将这项技术视为一种途径…… 加强隐私和安全保护这些是构成Firefox项目核心价值的支柱。作为一款开源浏览器,其代码库对独立研究人员和自动化代理(例如Anthropic公司自主研发的人工智能)均开放,可供其进行审计。

对 Mozilla 来说,关键在于保持…… 自动化审核与人工审核之间的平衡尽管人工智能模型可以加速错误检测并提出修复方案,但该基金会坚持认为,任何补丁——无论是人还是机器——在集成到欧洲和世界其他地区公民使用的浏览器中之前,都必须经过同等的技术审查。

这一经验也为其他软件项目提供了实用指导,包括在西班牙或欧盟境内开发的项目:如果希望基于人工智能的报告被接受,建议提出要求。 可重复性的明确证据 并建立专门的渠道进行此类披露,避免传统错误跟踪系统超负荷运转。

欧洲开发者和科技公司的经验教训

抛开围绕Firefox的媒体热潮,Anthropic和Mozilla之间的合作还得出了一些相关的结论。 初创企业、科技中小企业和大型欧洲公司 开发自己的软件或数字服务。

其中最明确的一点是: 人工智能辅助代码审计已具备经济可行性。以前需要专家团队花费数周时间才能完成的工作,现在只需几个小时或几天就能进行初步的自动化扫描,而且成本远低于彻底的人工审查。

另一个教训是…… 检测速度开始超过人类的纠正能力。像 Claude 这样的工具可以快速发现数十个潜在漏洞,但瓶颈在于内部团队能否在不破坏系统其他部分的情况下验证、确定优先级并修复这些问题。

很明显, 开源并不等同于安全保障。然而,它确实提供了一个显著的优势:透明度。像 Firefox 这样在欧洲因其注重隐私而广受欢迎的项目,允许社区和自动化代理持续审查代码,这在封闭的解决方案中是不可能实现的。

对于许多组织而言,将人工智能集成到开发流程中——例如,通过将自动化分析集成到 CI/CD 阶段——可能会变得非常困难。 在证明符合监管规定时,这是一个区分因素。随着未来欧洲网络安全和关键软件标准的应用,这一点变得越来越重要。

与此同时,该案例也提醒我们,攻击者同样可以利用类似的技术。 目前看来,防守方似乎占据优势。人工智能更擅长发现和帮助纠正缺陷,而不是利用缺陷,但没有人认为这种优势会持续很多年。

在这种情况下,欧洲企业(从银行到电子商务平台或数字公用事业公司)的安全经理们开始将这些工具视为必备工具,而不是实验性的附加工具。 这是他们软件保护策略的另一部分.

Firefox 和 Anthropic 的惨痛教训表明,经过良好引导和监督的 AI 模型可以发挥顶级安全审计员的作用:它可以审查大型代码库,检测复杂错误,并快速提出解决方案。与此同时,这也清楚地表明,最终决策权仍然掌握在人类团队手中,他们必须在软件和威胁演进速度不断加快的环境下,决定修补哪些漏洞、如何修补以及优先级如何设定。

创意人士必备的技术技巧:你应该知道的工具、应用和设置
相关文章:
创意人士的技术技巧:工具、应用和设置