​Perplexity 推出 BrowseSafe:为 AI 浏览器代理保驾护航

AI行业资讯6小时前发布 墨白
3.2K 0 0

近日,知名AI研究公司Perplexity推出了一套名为BrowseSafe的全新安全系统,旨在保护其AI浏览器代理免受日益复杂的网络内容操纵与攻击。该系统在Prompt注入攻击检测方面的准确率达到91%,表现优于当前市面上的主流方案——例如同类产品PromptGuard-2的检测率仅为35%,即使如GPT-5等前沿大模型在此类任务中的检测率也仅为85%。同时,该系统具备实时运行能力,可在实际使用中实现动态监测。

AI浏览器代理的快速发展为网络操作带来便捷,但也引入了新的安全挑战。今年早些时候,Perplexity推出集成AI代理的浏览器Comet,这类代理能够模拟用户行为进行网站浏览,并执行包括电子邮件处理、银行交易及企业内部系统操作在内的高权限任务。然而,这种高自由度的网络访问也为攻击者创造了条件,使其能够将恶意指令嵌入看似正常的网页内容中,诱使代理执行非授权操作,例如外发敏感数据。

为进一步应对此类风险,Perplexity对当前常见的安全检测方法展开了深入分析,发现如AgentDojo等现有评估基准难以适应现实中愈发复杂的网络攻击形式。这些基准多依赖于结构简单、内容单一的提示样本,无法有效覆盖真实网络环境中经过伪装或深度隐藏的攻击内容。

​Perplexity 推出 BrowseSafe:为 AI 浏览器代理保驾护航

为此,Perplexity构建了BrowseSafe Bench基准测试体系,围绕攻击类型、注入策略和语言风格三个维度定义攻击样本的覆盖范围。该基准特别关注“具有隐蔽性的内容”,即表面上看起来无害、但实际上可能构成威胁的复杂信息。通过采用混合专家架构,BrowseSafe能够在并行扫描中维持高检测效率,且不影响用户正常使用体验。

尽管如此,评估也揭示了该系统在某些情况下仍存在局限。例如,在多语言攻击场景中,检测率下降至76%。此外,隐藏在HTML注释中的攻击内容相比放置在页面可见区域的内容更容易被检测。Perplexity通过构建三层防御体系,将快速分类器与基于推理的大语言模型相结合,形成了从初步筛查到深度分析的整体防护机制。

虽然BrowseSafe在绝大多数情况下表现优异,但仍有近一成的攻击样本可绕过其检测,这也反映出网络安全威胁不断演变的本质。为此,Perplexity已公开其基准数据、模型及研究论文,以推动行业共同提升AI代理在开放网络环境中的交互安全性。

核心要点总结:

  • BrowseSafe在Prompt注入攻击检测中达到91%的准确率,显著高于当前主流方案。
  • AI浏览器代理因其高权限特性面临较高被操纵风险。
  • Perplexity通过构建多层防护体系与开放式研究,系统应对复杂网络攻击手法。
© 版权声明

相关文章