原贴链接

数月之后,Small(Mistral Small 22b)的写作质量看起来是无与伦比的。没有审查,长文本处理能力强,能很好地遵循提示。在定位(不会出现不合理的情节,比如房间两端的角色握手这种情况)方面非常出色,并且能很好地避免陈词滥调。能较好地调整回复长度并减少重复。

Llama 70b

  • 指令遵循能力很棒,但模型更大,有审查并且存在重复问题。

Command - R(32b)

  • 写作质量更好,但模型更大,总是显得更‘笨’,在超过6k文本后会忘记关键细节。

Qwen 2.5

  • 审查极其严格,我一直在尝试它,有时会有惊喜之处,但写作质量就像七年级作文水平。

任何角色扮演或者写作的人,你们都在用什么呢?我感觉好像没有任何长文本写作模型了,Mistral Small算是个例外。

讨论总结

原帖围绕是否存在比Mistral Small 22B更好的创意写作模型展开讨论。原帖作者对几种已知模型进行了评价,评论者们则从不同角度进行回应,有的推荐自己认为不错的模型,有的分享自己在使用模型中的特殊情况和应对方法,还有的对原帖中的模型评价提出不同看法,大家交流活跃且态度积极。

主要观点

  1. 👍 推荐尝试基础模型以获得真正的创造力
    • 支持理由:基础模型是互联网原始快照,不受偏见影响,工作流程自然
    • 反对声音:无
  2. 🔥 没有发现比Mistral Small 22B更好的模型(在特定条件下)
    • 正方观点:从自己使用经验出发,还未发现更好的
    • 反方观点:有人推荐了其他模型如1206 Gemini模型
  3. 💡 推荐使用Eva 0.2基础模型微调,因其审查情况和长文语境表现较好
    • 支持理由:相较于其他审查严重的模型,Eva 0.2有优势
    • 反对声音:无
  4. 👍 1206 Gemini模型在写作方面有不错的表现(不限于本地时)
    • 支持理由:自己体验过该模型写作表现好
    • 反对声音:无
  5. 🔥 不同意原帖对Command - R (32b)的部分评价,认为其语境不错但文风枯燥
    • 正方观点:从自己使用感受出发,觉得原帖评价不准确
    • 反方观点:原帖作者认为Command - R (32b)存在其他问题

金句与有趣评论

  1. “😂 Probably not what you’re looking for, but try base models.”
    • 亮点:打破常规思维,在大家都关注特定类型模型时推荐基础模型
  2. “🤔 I find the opposite, its context is good but its a dry writer.”
    • 亮点:针对原帖对Command - R (32b)的评价提出不同观点,引发思考
  3. “👀 I think what people tend to call "creative" is actually just randomness.”
    • 亮点:对创意这个概念进行独特解读,从模型角度给出新观点
  4. “😂 I haven’t found a better writer until Llama 3.3 70B, (NOT 3.2!)”
    • 亮点:强调了Llama 3.3 70B的优势且特别指出版本区别
  5. “🤔 gemma2 is pretty neat. I see it come up with styles and ideas I don’t see from other models, and it’s so fast.”
    • 亮点:点出gemma2 9b模型独特之处,包括创意和速度方面

情感分析

总体情感倾向为积极交流,大家都在分享自己真实的使用体验和看法。主要分歧点在于对某些模型的评价,如Command - R (32b)等,原因是大家使用场景、对模型要求以及对一些概念(如创意)的理解有所不同。

趋势与预测

  • 新兴话题:如利用不同模型组合(像用Qwen 32b打基础再让Mistral重写)来达到更好的创意写作效果可能会引发后续讨论。
  • 潜在影响:对于模型开发者来说,可以根据用户对不同模型的评价和需求来改进模型,对于创意写作者而言,有助于他们选择更适合自己的写作模型。

详细内容:

标题:寻找更优的创意写作模型:Reddit 上的热议与探索

在 Reddit 上,一则题为“Is there a better model than Mistral Small 22b for creative writing right now?”的帖子引发了众多网友的热烈讨论。该帖子获得了相当高的关注度,众多用户纷纷参与,分享了自己的见解和经验。

帖子主要探讨了当前各种创意写作模型的优劣,如 Mistral Small 22b、Llama 70b、Command-R (32b)、Qwen 2.5 等。其中提到,Mistral Small 22b 在写作质量、遵循提示、避免陈词滥调等方面表现出色,但也存在一些局限。

讨论的焦点主要集中在以下几个方面: 有人认为基础模型能展现出真正的创造力,比如在准备角色扮演数据集时,虽然需要大量手动编辑引导,但创造力无可比拟。有人通过指示 Mistral small 以章节形式创作来获得新颖格式的回应。还有人分享了对不同模型的使用体验,比如有人在使用 Command-R 时发现其在长语境下存在一些问题。

有用户指出,关键在于使用基础模型微调,如 Eva 0.2,其不像某些微调模型那样受到限制,且适用于 64K 以上的上下文。但也有人认为其写作风格较为枯燥。

有人表示,所有 Mistral 版本在超过 16k 后都会出现问题,而有的微调模型则能在更高的上下文长度下表现较好。

对于采样方法,有人认为 XTC 和 DRY 采样能让结果瞬间变好,但也有人认为这会影响模型的连贯性。

在众多观点中,有人认为 Mistral Small 被严重低估,在 Q8 下运行效果更出色,不仅在创意写作方面表现良好,在零样本编码方面也有不错的表现。还有人觉得 Gemma2 9b 速度快且效果好,但有时会失去重点。

总体而言,关于哪个模型更优的问题,目前尚未达成明确的共识。不同用户根据自己的需求和使用体验,有着各自的偏好和见解。但通过这次讨论,大家对各种模型的特点有了更深入的了解,为寻找更适合自己的创意写作模型提供了更多的参考和思路。