原贴链接

数月之后，Small（Mistral Small 22b）的写作质量看起来是无与伦比的。没有审查，长文本处理能力强，能很好地遵循提示。在定位（不会出现不合理的情节，比如房间两端的角色握手这种情况）方面非常出色，并且能很好地避免陈词滥调。能较好地调整回复长度并减少重复。

Llama 70b

指令遵循能力很棒，但模型更大，有审查并且存在重复问题。

Command - R（32b）

写作质量更好，但模型更大，总是显得更‘笨’，在超过6k文本后会忘记关键细节。

Qwen 2.5

审查极其严格，我一直在尝试它，有时会有惊喜之处，但写作质量就像七年级作文水平。

任何角色扮演或者写作的人，你们都在用什么呢？我感觉好像没有任何长文本写作模型了，Mistral Small算是个例外。

讨论总结

原帖围绕是否存在比Mistral Small 22B更好的创意写作模型展开讨论。原帖作者对几种已知模型进行了评价，评论者们则从不同角度进行回应，有的推荐自己认为不错的模型，有的分享自己在使用模型中的特殊情况和应对方法，还有的对原帖中的模型评价提出不同看法，大家交流活跃且态度积极。

主要观点

👍 推荐尝试基础模型以获得真正的创造力
- 支持理由：基础模型是互联网原始快照，不受偏见影响，工作流程自然
- 反对声音：无
🔥 没有发现比Mistral Small 22B更好的模型（在特定条件下）
- 正方观点：从自己使用经验出发，还未发现更好的
- 反方观点：有人推荐了其他模型如1206 Gemini模型
💡 推荐使用Eva 0.2基础模型微调，因其审查情况和长文语境表现较好
- 支持理由：相较于其他审查严重的模型，Eva 0.2有优势
- 反对声音：无
👍 1206 Gemini模型在写作方面有不错的表现（不限于本地时）
- 支持理由：自己体验过该模型写作表现好
- 反对声音：无
🔥 不同意原帖对Command - R (32b)的部分评价，认为其语境不错但文风枯燥
- 正方观点：从自己使用感受出发，觉得原帖评价不准确
- 反方观点：原帖作者认为Command - R (32b)存在其他问题

金句与有趣评论

“😂 Probably not what you’re looking for, but try base models.”
- 亮点：打破常规思维，在大家都关注特定类型模型时推荐基础模型
“🤔 I find the opposite, its context is good but its a dry writer.”
- 亮点：针对原帖对Command - R (32b)的评价提出不同观点，引发思考
“👀 I think what people tend to call "creative" is actually just randomness.”
- 亮点：对创意这个概念进行独特解读，从模型角度给出新观点
“😂 I haven’t found a better writer until Llama 3.3 70B, (NOT 3.2!)”
- 亮点：强调了Llama 3.3 70B的优势且特别指出版本区别
“🤔 gemma2 is pretty neat. I see it come up with styles and ideas I don’t see from other models, and it’s so fast.”
- 亮点：点出gemma2 9b模型独特之处，包括创意和速度方面

情感分析

总体情感倾向为积极交流，大家都在分享自己真实的使用体验和看法。主要分歧点在于对某些模型的评价，如Command - R (32b)等，原因是大家使用场景、对模型要求以及对一些概念（如创意）的理解有所不同。

趋势与预测

新兴话题：如利用不同模型组合（像用Qwen 32b打基础再让Mistral重写）来达到更好的创意写作效果可能会引发后续讨论。
潜在影响：对于模型开发者来说，可以根据用户对不同模型的评价和需求来改进模型，对于创意写作者而言，有助于他们选择更适合自己的写作模型。

详细内容：

标题：寻找更优的创意写作模型：Reddit 上的热议与探索

在 Reddit 上，一则题为“Is there a better model than Mistral Small 22b for creative writing right now?”的帖子引发了众多网友的热烈讨论。该帖子获得了相当高的关注度，众多用户纷纷参与，分享了自己的见解和经验。

帖子主要探讨了当前各种创意写作模型的优劣，如 Mistral Small 22b、Llama 70b、Command-R (32b)、Qwen 2.5 等。其中提到，Mistral Small 22b 在写作质量、遵循提示、避免陈词滥调等方面表现出色，但也存在一些局限。

讨论的焦点主要集中在以下几个方面：有人认为基础模型能展现出真正的创造力，比如在准备角色扮演数据集时，虽然需要大量手动编辑引导，但创造力无可比拟。有人通过指示 Mistral small 以章节形式创作来获得新颖格式的回应。还有人分享了对不同模型的使用体验，比如有人在使用 Command-R 时发现其在长语境下存在一些问题。

有用户指出，关键在于使用基础模型微调，如 Eva 0.2，其不像某些微调模型那样受到限制，且适用于 64K 以上的上下文。但也有人认为其写作风格较为枯燥。

有人表示，所有 Mistral 版本在超过 16k 后都会出现问题，而有的微调模型则能在更高的上下文长度下表现较好。

对于采样方法，有人认为 XTC 和 DRY 采样能让结果瞬间变好，但也有人认为这会影响模型的连贯性。

在众多观点中，有人认为 Mistral Small 被严重低估，在 Q8 下运行效果更出色，不仅在创意写作方面表现良好，在零样本编码方面也有不错的表现。还有人觉得 Gemma2 9b 速度快且效果好，但有时会失去重点。

总体而言，关于哪个模型更优的问题，目前尚未达成明确的共识。不同用户根据自己的需求和使用体验，有着各自的偏好和见解。但通过这次讨论，大家对各种模型的特点有了更深入的了解，为寻找更适合自己的创意写作模型提供了更多的参考和思路。

讨论总结#

主要观点#

金句与有趣评论#

情感分析#

趋势与预测#

详细内容：#