不管输入什么提示,我都无法让任何大型语言模型(LLM)输出比偶尔说几个脏话(如‘f - bombs’,使用‘damn’作形容词或感叹词,或者称用户为‘bastard’)更有趣的内容。如果我想让它代表一个会说很粗俗(如牧场主级别或军人级别的脏话)的角色,这样是不行的。真正高质量的脏话有其多样性、韵律和节奏感,但就我所知,这些模型的训练集中都没有这样的内容。例如,当一个牧场主发现有人在夜间擅闯他的土地时,我们应该能听到像‘If you and your choad - licking toadies don’t fuck off right now I’m going to tie your nipples in a knot and twist until you start to like it’(如果你们这些舔老二的奴才不马上滚蛋,我就把你们的乳头系成一个结然后拧,直到你们开始喜欢为止)之类的话。这句话的力量和效果来自于‘choad’和‘toadies’之间的内部韵律以及‘nipples’和‘knot’之间的头韵,并且通过‘until you start to like it’中隐含的重新语境化和指责得到加强,而不是简单的威胁。不管怎样,根据我的经验,大约百分之十的牧场主能够连续五到十分钟滔滔不绝地说出这种质量的脏话而不重复,我记得在20世纪80年代至少有几个教官似乎能一次持续说上整整一个小时。如果说得不够快,让人有机会打断,那就没效果了,如果经常重复就会失去力量并且听起来很愚蠢。不管我如何尝试诱导,我都无法从大型语言模型(LLM)的输出中得到类似的内容。没有韵律、没有内部韵律、没有头韵、没有指责性的重新语境化、没有意识到重复会让脏话听起来很愚蠢,甚至对这些词的含义以及哪些词适合描述哪些行为都没有很好的概念。这些模型认为激烈的脏话就是说几个‘f - bombs’,而且很多模型甚至连这个都做不到。
讨论总结
原帖抱怨语言模型(LLM)无法输出像人类那样有韵律、有内涵、不重复的高质量脏话。评论者们从多个角度进行回应,包括认为好的脏话是一种艺术,推荐各种可能输出脏话的模型(如Deepseek V3、Hugging Face上的某些模型、Eva - 70b等),还提出了一些解决模型输出高质量脏话的思路(如指定角色后手动添加脏话、使用错误的聊天预设、添加“以乔治·卡林的风格”等),整体讨论氛围较为理性地围绕着如何让模型输出高质量脏话展开。
主要观点
- 👍 语言模型难以输出高质量的脏话
- 支持理由:原帖作者尝试多种提示,语言模型输出的脏话缺乏韵律、节奏、独特表达等。
- 反对声音:有评论者指出Deepseek V3(中文)、Eva - 70b、monstral、R1等模型能够进行高质量的亵渎性话语输出。
- 🔥 好的脏话是一种艺术
- 正方观点:有评论者将好的脏话的艺术特点(韵律等)与人工智能输出缺失进行关联,认为人工智能在这方面无能如同不能创造自己的艺术。
- 反方观点:无明显反对观点。
- 💡 存在一些可能输出脏话的模型
- 解释:评论者推荐了Hugging Face上的模型、Dolphin - Mistral模型、grok等,还提到有基于4chan数据微调的模型,部分模型可能用于成人内容(NSFW)。
金句与有趣评论
- “😂 Deepseek V3 is very good at that, in Chinese tho 😅”
- 亮点:针对原帖对模型输出脏话的不满,提出不同看法,以中文语境下Deepseek V3的表现为例。
- “🤔 Eva - 70b can, monstral can. R1 is the best at it.”
- 亮点:直接指出某些模型能够进行高质量的亵渎性话语输出。
- “👀 4chan is a good source of high - quality creative swearing.”
- 亮点:提出4chan是高质量创造性脏话的来源,为自制模型提供数据来源的可能性。
情感分析
总体情感倾向比较中立,主要分歧点在于是否有模型能够输出高质量的脏话。原帖作者认为难以找到这样的模型,而部分评论者则推荐了一些他们认为可行的模型。可能的原因是不同人对模型的测试和使用经验不同,以及对“高质量脏话”的定义和理解存在差异。
趋势与预测
- 新兴话题:利用特定风格(如乔治·卡林的风格)或特定聊天预设来获取高质量的亵渎性话语输出可能会引发后续讨论。
- 潜在影响:如果真的能够找到可输出高质量脏话的模型,可能会对内容创作(如成人内容创作、特定角色塑造等)以及对语言模型能力边界的认知产生影响,但这也可能引发道德和伦理方面的争议。
详细内容:
《关于语言模型能否生成高质量粗口的热门讨论》
在 Reddit 上,有一篇题为“Are there any models capable of high-quality profanity?”的帖子引发了广泛关注,获得了众多点赞和大量评论。帖子的主要内容是作者表示无论怎样提示,都无法让语言模型生成除了简单爆粗口之外更有趣、更高质量的粗口表达,还详细阐述了真正优秀的粗口所具备的特点,比如韵律、押韵和重新语境化等,指出当前的语言模型在这方面存在明显不足。
讨论的焦点主要集中在语言模型生成高质量粗口的能力以及相关的解决方案。有人认为 AI 不能创造自己的艺术,而好的粗口是真正的艺术;有人提到只有一两个语言模型可用于 NSFW 内容;有人指出 Huggingface 有一些未经审查的模型,但多数高级基础模型需要突破限制和提示工程才能更进一步;还有人尝试了从 4chan 训练的模型,认为它有一定效果但仍需改进。
有用户分享道:“Huggingface 有一些模型是未经审查的,但大多数当前的高级基础模型需要一些突破限制和提示工程才能更进一步。” 还有用户表示:“我发现了 GPT-4chan,它似乎有一定的刺激性,甚至有一点韵律和节奏,但距离有文采还差得很远。”
讨论中存在的共识是大家都意识到当前语言模型在生成高质量粗口方面的能力有限。特别有见地的观点是有人提出可以尝试加入“in the style of George Carlin”的提示,或许会有所改善。
总的来说,关于语言模型能否生成高质量粗口的讨论仍在继续,大家都在探索更好的方法和途径。
感谢您的耐心阅读!来选个表情,或者留个评论吧!