我使用过的大多数大型语言模型生成的幽默听起来都非常乏味、合成,而且它们并不总能创造出新颖、原创或富有创意的内容。那么,有没有哪些模型能够写出听起来不像幼儿幽默的笑话呢?
讨论总结
本次讨论主要聚焦于大型语言模型(LLMs)在幽默生成方面的表现和挑战。参与者普遍认为现有模型生成的幽默内容单调、缺乏新意,且往往显得幼稚。讨论中涉及了多种改进方法,如创意调优、参数调整、角色卡片的应用等,以及对幽默科学和文本幽默的深入探讨。此外,也有评论提到了幽默的主观性和模型在不同幽默类型上的表现差异。总体而言,讨论反映了对于提升模型幽默生成能力的期待和探索。
主要观点
- 👍 大多数语言模型生成的幽默显得枯燥和合成,缺乏新意和创意。
- 支持理由:评论者普遍反映模型生成的幽默内容单调,缺乏创新。
- 反对声音:无明确反对声音,但有评论提到通过创意调优可以改善。
- 🔥 经过创意调优的模型能提供更多有趣的变体,但幽默生成能力仍然有限。
- 正方观点:创意调优可以增加幽默的多样性和趣味性。
- 反方观点:即使经过调优,模型生成的幽默仍难以达到人类水平。
- 💡 使用高温度参数可能有助于改善模型的幽默生成效果。
- 解释:高温度参数可以增加生成内容的随机性和创新性。
- 👀 模型在生成新笑话时容易陷入老套,如使用“田野中的杰出”或“原子”等笑话。
- 解释:模型生成的笑话往往缺乏新颖性和原创性。
- 😂 模型在处理观察性幽默时表现较好,而在设置-笑点或双关语类型的幽默上表现较差。
- 解释:不同类型的幽默对模型的挑战不同,观察性幽默相对容易生成。
金句与有趣评论
- “😂 RegisteredJustToSay:I’ve tried a lot, and generally the better ones are the ones tuned for creativity/pretend (claude, finetunes, etc) but honestly none of them are good at it at all.”
- 亮点:反映了创意调优模型在幽默生成方面的局限性。
- “🤔 aitookmyj0b:There’s a whole science about humor.”
- 亮点:提到了幽默的科学性,增加了讨论的深度。
- “👀 Cool-Hornet4434:Why do scientists not trust atoms? Because the it saw the salad dressing! ba-dum-tiss”
- 亮点:通过自创的科学笑话批评语言模型的幽默生成能力。
情感分析
讨论的总体情感倾向较为批判和失望,主要是因为大多数语言模型生成的幽默内容显得乏味且缺乏新意。主要分歧点在于对创意调优和参数调整的效果评价,以及对不同幽默类型的生成能力。可能的原因包括幽默的主观性、模型的技术限制以及对幽默本质的理解不足。
趋势与预测
- 新兴话题:未来可能会有更多关于如何通过创意调优和参数调整来提升模型幽默生成能力的讨论。
- 潜在影响:改进后的模型可能在社交媒体、娱乐产业等领域发挥更大作用,但也需要注意避免生成不当内容的风险。
详细内容:
《探索语言模型的幽默生成能力》
在 Reddit 上,有一篇题为“Best model for humour?”的帖子引起了广泛关注。该帖主要探讨了大多数语言模型生成的幽默内容十分乏味、生硬,缺乏新意和创意,并询问是否存在能写出不那么幼稚的笑话的模型。截至目前,这篇帖子收获了众多点赞和大量评论。
讨论的焦点集中在对不同模型幽默生成能力的评价和分析上。有人表示,经过尝试,通常为创造力和假装而调整的模型(如 Claude、finetunes 等)相对较好,但说实话,没有一个模型在这方面表现出色。创造性的模型只是能提供更有趣的变化,有时能起作用,并且记得要使用较高的温度。还有人指出,一般来说模型在观察性幽默方面的表现比设置笑点或双关语类型的幽默要好。
有人认为幽默是主观的,即使推荐一个擅长幽默的人都是不可能的任务。但也有人反驳说,虽然幽默主观,可大多数模型感觉根本没在努力,即便被明确要求以某种方式写笑话。
有人测试了不同模型的幽默生成能力,如 Thomas-Lore 每次有新模型出来都会在 lmsys 上进行测试,目前还没有赢家,它们都相当差。
有人分享自己的经验,如 swagonflyyyy 表示,通过增加温度、分配和打乱一定数量的个性特征,以及改变幽默风格等方式,L3.1 在某些情况下表现不错。
不过,也有人指出定义喜剧本身就是个难题,人类都难以完全搞清楚。语言模型不能生成它未经过训练的内容,在我们能 100%定义“喜剧”的本质之前,不能期望算法能区分机智的评论和绝对搞笑的笑话。
尽管当前的语言模型在幽默生成方面存在诸多不足,但人们仍在不断探索和尝试各种方法,期待未来能有更好的表现。
感谢您的耐心阅读!来选个表情,或者留个评论吧!