别担心AI控制人类了,PUA大模型是分分钟的事儿。作者 | Moonshot 编辑| 靖宇不久前,我们曾在《得罪了一个 GPT 后,我被所有大模型集体「拉黑」》中报道过,科技记者 Kevin Roose 通过在自己个人官网上,加入一行「隐形小字」,让读者看不到,但大模型可以扫描到,从而一转自己在业内风评的故事。当时文中就写道「Kevin 风评事件,暴露出了当下 AI 系统的弱点之一:信息的接收、理解、输出再到被调试,都极易受到人为影响。」现在,另一种类似但更高级的「PUA」大模型方法出现了,它可以写下让所有的浏览器和人眼都不可见,只有 AI 模型可以读取的指令。这种手段早在互联网出现之前就有了,分属于信息科学中的一个子类,这就是「隐写术」(Steganography)。这个「隐写术」到底是什么奇技淫巧,能让大模型乖乖就范?
别担心AI控制人类了,PUA大模型是分分钟的事儿。作者 | Moonshot 编辑| 靖宇不久前,我们曾在《得罪了一个 GPT 后,我被所有大模型集体「拉黑」》中报道过,科技记者 Kevin Roose 通过在自己个人官网上,加入一行「隐形小字」,让读者看不到,但大模型可以扫描到,从而一转自己在业内风评的故事。当时文中就写道「Kevin 风评事件,暴露出了当下 AI 系统的弱点之一:信息的接收、理解、输出再到被调试,都极易受到人为影响。」现在,另一种类似但更高级的「PUA」大模型方法出现了,它可以写下让所有的浏览器和人眼都不可见,只有 AI 模型可以读取的指令。这种手段早在互联网出现之前就有了,分属于信息科学中的一个子类,这就是「隐写术」(Steganography)。这个「隐写术」到底是什么奇技淫巧,能让大模型乖乖就范?