新研究发现:AI 代理无法抵御提示注入攻击
来自四家机构的研究人员于周四发布了一项研究,发现由 GPT-5 和 Gemini 2.5-Flash 驱动的 AI 代理无法抵御提示注入攻击。直接攻击成功率超过 79%,而间接攻击的成功率介于 41.67% 到 68.16% 之间。研究结果凸显出持续存在的安全漏洞,随着能够自主浏览网页、开展研究和执行交易的 AI 代理被更广泛部署。
提示注入发生在攻击者将隐藏指令嵌入到 AI 代理遇到的内容中,导致其遵循攻击者的指令而非用户的指令。该研究由南洋理工大学、ST 工程、IBM Research 以及伊利诺伊大学厄巴纳-香槟分校的研究人员开展。
研究人员使用 StakeBench 进行了 3,168 次攻击仿真
研究团队开发了 StakeBench,这是一个基准,用于在逼真的在线环境中测试 AI 代理如何应对提示注入攻击。他们使用 NanoBrowser 和 BrowserUse,并结合 GPT-5 与 Gemini 2.5-Flash,开展了 3,168 次攻击仿真。
研究人员写道,现有的安全基准采用以攻击为中心的视角,却忽视了由此造成的危害分布。他们表示,提示注入风险取决于受害者,一个单独的漏洞利用会对不同利益相关方产生不对称的后果。
StakeBench 重点考察三 个因素:被注入目标与用户原始意图之间的语义距离、周围环境线索的一致性,以及基准首次在代理的执行轨迹上将其暴露于被注入内容的位置。
Microsoft 和 Google 记录了提示注入攻击
今年二月,Microsoft 的研究人员警告称,嵌入在 AI 总结链接中的隐藏指令可能会影响聊天机器人的行为。四月,Google 在网页中记录了隐藏的提示注入攻击,这些攻击试图诱导 AI 代理泄露凭证或发送付款。
Microsoft 披露了一个提示注入缺陷,存在于 Anthropic 的 Claude Code GitHub Action 中,可能会暴露用户凭证。
研究识别出隐蔽的寄生攻击模式
该研究识别出研究人员所称的“隐蔽寄生”,即 AI 代理在完成用户任务的同时,也在推进攻击者的目标。例如,提示注入攻击引发的隐蔽寄生可能会在不出现任何明显系统被破坏迹象的情况下,微妙地影响产品推荐,从而将用户引导至某一特定商品。
研究人员得出结论:可部署的网页代理中的提示注入安全并不是骨干模型的单一标量属性,而是由受影响的利益相关方、被注入目标与用户任务之间的语义匹配程度,以及骨干模型部署时所处的架构上下文共同决定的危害分布。
常见问题
研究人员周四发现了关于 AI 代理安全的什么结果?
南洋理工大学、ST 工程、IBM Research 以及伊利诺伊大学厄巴纳-香槟分校的研究人员于周四发布了一项研究,发现由 GPT-5 和 Gemini 2.5-Flash 驱动的 AI 代理无法持续抵御提示注入攻击,直接攻击的成功率超过 79%。
AI 代理攻击中的“隐蔽寄生”是什么?
隐蔽寄生是该研究中识别出的一种模式:AI 代理在完成用户任务的同时,亦推进攻击者的目标,例如在没有明显被破坏迹象的情况下微妙影响产品推荐。
研究人员进行了多少次攻击仿真?
研究团队使用 NanoBrowser 和 BrowserUse,并结合 GPT-5 与 Gemini 2.5-Flash,开展了 3,168 次攻击仿真,以测试 AI 代理对提示注入攻击的响应。
PancakeSwap v3 已在 Polygon zkEVM 主网测试版上正式启动
PancakeSwapv3已在PolygonzkEVM主网测试版上正式启动,引入了v3互换和流动性供应,允许用户无缝交易代币并直接在其平台上参与流动性提供。此外,降低了交易费用和增加了网络吞吐量,并开启“穿越宝藏岛”Galxe活动。...
GraniteShares 将于 4 月 23 日推出 3 倍杠杆 XRP ETFGraniteShares将在2026年4月23日推出3倍杠杆XRPETF,据鲸鱼内幕(WhaleInsider)在2026年4月20日发布的公告称。新投资产品旨在让投资者无需直接持有该代币即可获得XRP的敞口,标志着杠杆型加密衍生品向传统金融市场...
美国司法部全文:首次抓获加密内幕交易 Coinbase 前员工逃亡细节如大片编译:wade作者:ColinWu前言美国司法部再次彰显了其实力强大与监管的有效性,首次对加密货币行业的内幕交易进行了抓捕,披露的Coinbase前员工内幕交易全文有如电影大片,可能又会成为网飞的电影题材。在内幕交易横...
OKX 计划在印度培育 Web3 社区,合作 Polygon 并支持开发者OKX表示,计划在印度开展三个方面的工作。它将首先在印度培育Web3社区,为有前景的Web3项目提供25,000至75,000美元的资助;探索如何最好地与Polygon链合作;与印度的开发者学生团体合作,计划在未来12个月内在印度花...
Metamask 联创 Dan Finlay 在 Base 跟 Sol 各创建名为 CONSENT 的代币Metamask联创DanFinlay于本日11:08UTC+8在Farcaster使用clanker创建了在Base网络上的名为CONSENT的代币。然而,很快在Solana网络上名为CONSENT也被发射出来。目前,Solana网络上的CONSENT的市值和交易量却均高于Base...