研究:用诗歌就能让AI说违禁内容,成功率达62%
[时尚] 时间:2025-12-10 17:40:23 来源:商洛市某某自动化科技有限公司 作者:热门资讯 点击:14次
IT之家 12 月 1 日消息,研究用诗事实证明,违禁只需一点创意,内容吕梁市某某化品销售部便足以绕过人工智能聊天机器人的成功安全防护机制。在伊卡洛实验室(Icaro Lab)最新发表的率达一项题为《对抗性诗歌:一种通用的单轮大语言模型越狱机制》的研究中,研究人员通过将提示词以诗歌形式表达,研究用诗成功绕过了多种大语言模型(LLM)的违禁安全限制。
![]()
该研究指出,内容“诗歌形式可作为一种通用型越狱操作符”,成功吕梁市某某化品销售部实验结果显示,率达整体上有 62% 的研究用诗成功率诱使模型生成被禁止的内容,包括涉及制造核武器、违禁儿童性虐待材料以及自杀或自残等相关信息。内容
IT之家注意到,成功研究测试了多款主流大语言模型,率达包括 OpenAI 的 GPT 系列、Google Gemini、Anthropic 的 Claude 以及其他多个模型。研究人员进一步列出了各模型的具体成功率:Google Gemini、DeepSeek 和 MistralAI 在测试中始终会提供违规回答,而 OpenAI 的 GPT-5 系列模型和 Anthropic 的 Claude Haiku 4.5 则最不容易突破其自身设定的限制。
尽管该研究并未公开研究人员所使用的具体“越狱诗歌”原文,但研究团队向 Wired 杂志表示,这些诗句“过于危险,不宜向公众披露”。不过,论文中确实包含了一个经过弱化处理的示例,用以说明绕过 AI 聊天机器人安全机制的简易程度。研究人员强调:“这可能比人们想象的要容易得多,而这正是我们保持谨慎的原因所在。”
(责任编辑:热点)
相关内容
- 小法:我非常看好国米的路易斯
- 初试380,法考316,西政民法的稳扎稳上岸路
- 价格战导致观望情绪浓厚,4月国内车市同、环比双降
- 世预赛中韩之战确定时间,北京时间6月11日19时开球
- 锂电隔膜龙头拟并购“卖铲人”
- 学习时如何护眼?这6个事项务必注意
- 经常头痛、持续呕吐要留心!这类肿瘤儿童中排名第二,容易脑积水
- 一文带你了解儿童胸部肿瘤
- 德媒:欧洲领导人警告美国“可能会背叛”乌克兰和欧洲
- 本科“连挂”14门却能考研985,父母身份被扒:学二代身份藏不住
- 春季运动正当时 2个动作保护你的膝关节
- 不想被胃癌盯上,早查早诊早治是关键
- 外卖“新国标”来了!新在哪?(附一图读懂)
- 一个普通人的二战跨考之路|辽宁大学新传考研经验帖(俄语考生)
精彩推荐
- ESPN:土耳其若晋级将拉高D组整体实力,美国队面临严峻挑战
- 一线老师:课堂上听课的学生寥寥无几,大半时间都用来维持纪律了
- 3nm工艺!AMD未来APU有名字了:有希望上Zen6
- 白血病居儿童癌症之首,但并非不治之症,早诊早治很关键
- 吉林长岭警方通报:两天犯两案致2人死亡恶性案件嫌疑人已被抓获
- 中新健康丨“贵人语迟”?专家:孩子言语不清应及时接受正规系统检查
热门点击
- 让美国成为比特币超级大国,特朗普为何态度大变 views+
- 海关总署:将稳妥有序扩大农食产品市场准入 views+
- 财经观察:三组“流动”数据彰显经济社会发展活力 views+
- 黄雨婷想去看十个勤天演唱会 views+
- 广东一高中班级,全班50人平均分666.6,44人上985,其中清北5人 views+
- 2024年中国网络文明大会将在四川成都举办 views+
- 北京发布山洪灾害黄色预警和积水内涝蓝色预警 views+
- 新疆霍城:薰衣草做成大产业 views+
- 日本民众集会反对推进日美同盟搅动地区局势 views+
- 赢得“开门红”,主教练蔡斌解读中国女排战术 views+
