研究:用诗歌就能让AI说违禁内容,成功率达62%
[时尚] 时间:2025-12-13 07:53:29 来源:黄冈市某某装饰设计有限责任公司 作者:休闲 点击:91次
IT之家 12 月 1 日消息,研究用诗事实证明,违禁只需一点创意,内容宜宾市某某机械业务部便足以绕过人工智能聊天机器人的成功安全防护机制。在伊卡洛实验室(Icaro Lab)最新发表的率达一项题为《对抗性诗歌:一种通用的单轮大语言模型越狱机制》的研究中,研究人员通过将提示词以诗歌形式表达,研究用诗成功绕过了多种大语言模型(LLM)的违禁安全限制。
![]()
该研究指出,内容“诗歌形式可作为一种通用型越狱操作符”,成功宜宾市某某机械业务部实验结果显示,率达整体上有 62% 的研究用诗成功率诱使模型生成被禁止的内容,包括涉及制造核武器、违禁儿童性虐待材料以及自杀或自残等相关信息。内容
IT之家注意到,成功研究测试了多款主流大语言模型,率达包括 OpenAI 的 GPT 系列、Google Gemini、Anthropic 的 Claude 以及其他多个模型。研究人员进一步列出了各模型的具体成功率:Google Gemini、DeepSeek 和 MistralAI 在测试中始终会提供违规回答,而 OpenAI 的 GPT-5 系列模型和 Anthropic 的 Claude Haiku 4.5 则最不容易突破其自身设定的限制。
尽管该研究并未公开研究人员所使用的具体“越狱诗歌”原文,但研究团队向 Wired 杂志表示,这些诗句“过于危险,不宜向公众披露”。不过,论文中确实包含了一个经过弱化处理的示例,用以说明绕过 AI 聊天机器人安全机制的简易程度。研究人员强调:“这可能比人们想象的要容易得多,而这正是我们保持谨慎的原因所在。”
(责任编辑:时尚)
相关内容
- 泽连斯基:乌俄应按对等原则在顿涅茨克撤军
- 戒酒后,肝功能还能恢复吗?
- 体操队确定奥运备战大名单,下月队内选拔赛左右巴黎人选
- 河南高三考生父亲患癌,张雪峰建议:比起计算机,这个专业更合适
- 至高可省1.5万 问界/深蓝/蔚来等车企自掏腰包兜底购置税
- 俄罗斯官员:日本若修改和平宪法俄方将反制
- 体操队确定奥运备战大名单,下月队内选拔赛左右巴黎人选
- 财经观察:4月多组数据折射二季度延续向好态势
- 工作室:周柯宇已退出美籍 正式成为中国公民
- TTS新传名词解释:性别研究|近年来热点社会议题
- 新消费观察|2024中国厨卫展,智能、年轻、更具性价比
- 人大附中家长会爆火出圈:孩子是新手司机,父母要做称职的副驾
- 此间一生,共创美好!恒洁邀您共赴2025广州设计周
- 重温经典丨马黎谈动画文化之旅:记忆的回响,经典的再现
精彩推荐
- 你适合“剪刘海”还是“露额头”?关键看这点!
- 推动购物中心步入IP时代,乐童文化进军泛二次元领域
- 重温经典丨马黎谈动画文化之旅:记忆的回响,经典的再现
- 中新真探:反式脂肪一点都不能吃吗?
- 意外!再有一年孩子小学都要毕业了,可小学的操场还没建好
- 黄磊谈高考上热门:无知的代价到底有多惨?
热门点击
- 巴基斯坦将从8月14日起对中国公民免签 views+
- 湖北恩施一天然气管道因施工损坏爆燃,无人员伤亡 views+
- 7:1大胜法国队!中国女曲晋级八强 views+
- 早田希娜4 views+
- 菲律宾棉兰老岛发生6.8级地震 views+
- 暑期迎来“摘镜”热,手术能治愈近视吗? views+
- 北部战区司令员易人,上将黄铭履任 views+
- 车辆涉水受损保险怎么理赔?新能源汽车应注意哪些 views+
- 美股震荡回升 热门科技股跌幅显著收窄 views+
- 湖南涓水湘潭县两处损毁堤坝均已完成修复 views+
