AudioHijack:听不见的指令以 96% 的成功率劫持 AI 语音模型

lanshan2026-05-27 02:57:06decrypt

浙江大学研究人员开发了 AudioHijack,这是一种攻击方法:在音频中嵌入难以察觉的命令,以 79–96% 的成功率操纵大型音频语言模型。该攻击在圣弗朗西斯科举行的第 47 届 IEEE 安全与隐私研讨会上进行了展示。AudioHijack 的工作原理是:在数字音频波形内部修改数值,这种改动对人类听众而言难以察觉,但仍会影响 AI 模型对信号的解读。研究称,被操纵的音频即使在剪辑中包含合法的用户指令,也能够覆盖或重定向模型的行为。

“训练这个信号只需要半小时,然后因为这个信号与上下文无关,你就可以在任何你想要的时候攻击目标模型,无论用户说什么,”浙江大学第一作者、博士生孟晨(Meng Chen)表示。

How AudioHijack Differs from Traditional Attacks

AudioHijack differs from traditional prompt injection attacks because it does not manipulate what the user says to the AI. Instead, it alters the audio signal itself, embedding hidden instructions inside sounds humans cannot hear. This approach makes the attack harder to defend against because it bypasses safeguards designed to detect suspicious text prompts.

Capabilities and Tested Systems

Researchers tested AudioHijack on 13 open-source AI voice models and found it could make them refuse requests, spread false information, insert harmful links, change personality, or perform actions the user never asked for, including web searches, file downloads, and emails containing personal data. The attacks also worked on commercial voice AI systems from Microsoft and Mistral that use similar technology.

Delivery Methods

Possible delivery methods include online videos, music clips, voice notes, or audio from Zoom calls uploaded to AI transcription services. The team also demonstrated similar attacks in live AI voice chats through unpublished follow-up work.

防御局限

研究人员测试的最有效防御措施是监控模型的内部注意力机制。不过,他们也发现,攻击者如果了解该防御,可以在维持攻击效果大部分的同时,削弱操纵的强度。

“这些单点防御很难抵抗我们的攻击,因为我们发现,这些模型要区分正常用户意图和我们的对抗攻击非常困难,”陈表示。

根据研究,这些研究人员正在调查该技术是否能够通过共享的开源音频组件,从 OpenAI 和 Anthropic 的封闭模型中实现攻击。


币安宣布于 22 日 18:30 上线Synapse(SYN)

币安宣布于22日18:30上线Synapse(SYN),并开放现货交易对。Synapse是一个去中心化跨链基础设施,提供跨链桥梁、沟通协议及稳定币交易等产品。SYN是项目的原生应用代币,用以支付桥梁交易费用、参与流动性挖掘和治...

ZachXBT:Blockchain Bandit 攻击者将 5.1 万枚 ETH 归集至某多签地址,约合 1.722 亿美元

据链上侦探ZachXBT监测,BlockchainBandit攻击者在休眠多年后再次活跃,将51,000枚ETH(1.722亿美元)归集到一个多签地址(0xC45C36017b0B7708f493534Ca4f0930964C1D542)中。...

近 24 小时,Meme 交易终端 GMGN 收入达 58.53 万美元

据DeFiLlama数据,近24小时,Meme交易终端GMGN收入达58.53万美元,超过了Hyperliquid,这可能与近期Solana和BNBChainMeme行情回暖有关。

奢侈手表成为 Arcade 平台上贷款的抵押品,利用 NFT 担保确保所有权

近日有奢侈手表持有者将手表委托在第三方担保公司,然后担保公司给持有者发送了一个代表手表所有权的NFT。随后NFT持有者在Arcade上将其作为抵押品获得贷款。目前...

Huma Finance 宣布完成 830 万美元种子轮融资

DeFi项目HumaFinance宣布完成830万美元种子轮融资,用于建立收入支持的贷款协议,RaceCapital和DistributedGlobal共同领投,ParaFi、CircleVentures和FoliusVentures等参投,启动合作伙伴包括Circle、RequestNetwork...

上一篇:韩国韩元兑美元上涨 0.24% 至 5 月 26 日的 1,508
下一篇:9 个加密钱包控制 Polymarket 争议结果