原贴链接

好久不见,角色扮演的小伙伴们!希望生活对你们都很好!自从我在LLM社区上次推荐帖子以来,发生了很多事情——新模型发布了,甚至全新的架构也出现了!迫不及待想看看我们从这里走向何方,因为未来看起来一片光明!

话虽如此,我来这里是为了推荐一个模型,而你们来这里很可能是因为想了解它(或者是因为推荐算法讨厌你)。废话不多说,让我们直接进入这个可爱的布丁的核心吧!女士们,先生们,以及其他朋友们;我很自豪地介绍一个我目前首选的RP/ERP模型——NemoMix-Unleashed! https://huggingface.co/MarinaraSpaghetti/NemoMix-Unleashed-12B

你们中的一些人可能会对这个推荐感到好奇。问我:‘等一下,Mari,这不是你的模型吗?’啊,你抓住我了,你这调皮的小家伙!答案是:是的。也不是。我的意思是,我做了这个合并——这是真的——但合并中的独特模型不是我创造的!它们是由Intervitens、Sao10K和Nbeerbower等了不起的人制作的!当然,还有Mistral团队(感谢上帝/-s创造了法国人)。事实上,我收到了一些关于这个模型的非常积极和正面的反馈,而且我自己也在使用它,我问——为什么不呢?

image

我不会过多地吹嘘它,因为我显然非常谦虚,但如果你已经读到这里——为什么不亲自试试呢?特别是如果你正在寻找能在更高上下文中工作的模型!但在我进入详细内容之前,这是我通常使用的设置。我在我的家用8_0 GGUF量化器上运行64k上下文,未缓存,使用24GB的VRAM。我使用SillyTavern作为前端,Oobabooga的WebUI作为后端。你可以从总是可靠的Bartowski那里获取其他尺寸(谢谢你): https://huggingface.co/bartowski/NemoMix-Unleashed-12B-GGUF

重要提示!不要对任何Nemo模型使用8位或4位上下文缓存!根据我的个人测试和其他人遇到的问题,似乎Nemo模型在这些标志开启的情况下表现明显更差!

我还建议为任何Nemo模型选择GGUF而不是exl2。过去它们在那种格式下不能正常工作,尽管现在已经修复了。尽管如此,我个人还是选择GGUFs,以防万一。

这里还有我当前的模型设置。这些也在模型的卡片上提到。 采样器: https://huggingface.co/MarinaraSpaghetti/SillyTavern-Settings/blob/main/Parameters/Top(A)Kek.json 故事字符串: https://huggingface.co/MarinaraSpaghetti/SillyTavern-Settings/blob/main/Customized/Mistral%20Custom%20Improved/Mistral-Custom-Improved-StoryString.json 指令: https://huggingface.co/MarinaraSpaghetti/SillyTavern-Settings/blob/main/Customized/Mistral%20Custom%20Improved/Mistral-Custom-Improved-Instruct.json

好了,说完了这些,我们为什么不直接进入为什么你应该给这个模型一个机会的原因呢?一如既往,我的模型有四个主要关注点,而且一如既往——这个模型都符合。我会尽量保持客观。

  • **上下文大小:**作为一个真正的大小女王,我只对能够处理32k+上下文的模型感兴趣。理论上,Nemo应该有高达128k的上下文,但我们都知道这在实践中是怎么回事。不过,对于这个合并,我选择了那些在我这里能在64k上下文中工作的模型,并且只使用了那些。所以我可以安全地确认它能在高达64k的上下文中工作!还没有在更高的上下文中尝试过,所以请记住这一点。
  • **保持角色:**这是我评论中唯一有点问题的点,因为该模型使用的Mistral指令格式没有适当的系统提示。稍后会有更多关于它的抱怨。尽管如此,我觉得我的角色保持了角色,不会突然发生360180度的性格变化。万岁!
  • **写作风格:**它不能像RP-Stew那样做出搞笑的比喻,但它感觉自然,时不时让我发笑,并且如果你追求特定的风格,它能很好地模仿你的风格。不像我之前测试的Mistral模型那样啰嗦。
  • **智能:**老实说?我认为这是这个模型最大的优势。它感觉和34B模型一样聪明,能够很好地连接事实或读懂字里行间的意思!我不需要像对白痴一样详细说明一切,考虑到模型只有12B的大小,这是一个了不起的成就。

在一般的角色扮演方面,从我看到的其他人的截图来看,它似乎能很好地处理短的星号格式和长的、小说风格的格式,尽管我只使用第二种。它还能产生故事!我的测试中没有道德问题,也没有明显的拒绝,尽管我不是那种问模型如何制造大规模杀伤性武器的人。还没。

唯一的问题,也是所有基于Nemo的模型中普遍存在的——是重复问题。Nemo非常喜欢模式和重复一次有效的短语,所以你想要一直保持DRY。幸运的是,在我做过的所有合并中,这个是最少的。你看,Nemo非常喜欢模式和重复一次有效的短语,所以你想要一直保持DRY。

我还有一个——最大的——抱怨,这也适用于所有基于Mistral的模型。该死的指令格式。Mistral团队中是谁一直坚持认为糟糕的有争议的[INST]标签格式是你想要的?!如果Mistral团队中有人在读这篇评论(尽管我非常怀疑)——是有人在强迫你们使用它吗?你们中有人和魔鬼做了交易,说你们的模型只有在使用这种格式训练时才这么好吗?!请,为了任何正在倾听的神的爱,改变它——任何——其他的!或者,至少,为系统提示添加适当的[SYSTEM]标签。简单的修复将解决世界上所有的问题!谢谢你。

顺便说一下,不确定我是否提到过Nemo非常喜欢模式和重复一次有效的短语,所以你想要一直保持DRY?

好了,我们说完了,让我们来看看一些酷的例子,你可能不会费心去读,但我还是会贴出来!请记住,所有这些消息都是在64k上下文中生成的。我扮演2137,其他所有人都是由模型扮演的。

我之前提到的,我真的很喜欢的一点是,它能很好地处理我的奇怪风格和比喻。我不需要克制自己或非常直接地表达一切,以便AI正确处理概念。我认为下面的例子很好地说明了这一点。另一个很酷的事情——模型引用了聊天历史中发生的事情和事件!它不是一个完美的RAG模型,因为即使是官方指令也有这个问题,但对于角色扮演来说已经足够好了。根据我的经验,它比RP-Stew更频繁地做到这一点。

例子一!

还有一件很酷的事情——这个模型擅长角色扮演,它不会读懂你的心思!尽管,这可能也要感谢我的提示。它在推动情节发展方面也非常有创意。我真的很喜欢它不是简单地继续对话,而是引入了一个潜在的威胁或兴趣点。

例子二!

所以,这里有一些我也很喜欢的东西。血腥!血腥警告,我想。

例子三!

但当然,对于所有有文化的Redditors来说,我还有一个ERP写作的样本。可以说,我真的很喜欢在ERP聊天中测试它,哈哈。NSFW警告!

NSFW例子!

好了,这就是我现在要展示的全部内容。如果你已经读到这里——哇,谢谢你!你今天会有一个幸运的一天(100%真实)!如果这个模型听起来很有趣,请去看看它,并确保留下一些反馈!我一直在寻找新的模型来测试、审查,现在还有合并!希望你和它一起度过愉快的时光。

特别感谢Drummer的服务器上的每个人(包括可爱的狗狗本人)帮助我进行测试、建议,以及只是普遍很酷!还有,感谢Prodeus Unity为我做了exl2量化,感谢ParasiticRouge教我如何合并,并帮助我!

这就是全部了!干杯,直到下次!

PS,我提到过Nemo非常喜欢模式和重复一次有效的短语吗?所以你——

讨论总结

Reddit用户围绕NemoMix-Unleashed模型的推荐和使用体验展开了广泛讨论。用户们分享了该模型在处理复杂场景、多角色互动、写作风格和智能表现方面的优势,特别是在高上下文处理能力上的表现。同时,讨论中也指出了模型存在的重复问题和格式选择上的不便,如Mistral Instruct格式的争议。此外,用户们还探讨了模型的硬件配置、缓存设置和与其他模型的比较。整体上,讨论呈现出对模型性能的积极评价和对技术细节的关注。

主要观点

  1. 👍 高上下文处理能力
    • 支持理由:模型能够处理高达64k的上下文,适合需要高上下文处理能力的用户。
    • 反对声音:未尝试更高上下文,需用户自行测试。
  2. 🔥 角色保持能力
    • 正方观点:模型在保持角色一致性方面表现良好,尽管存在一些格式问题。
    • 反方观点:Mistral Instruct格式限制了角色的保持能力。
  3. 💡 写作风格自然
    • 解释:模型能够模仿特定风格,且不显啰嗦,适合多种角色扮演需求。
  4. 🌟 智能表现出色
    • 解释:模型在智能表现上接近34B模型,能够很好地连接事实和理解隐含信息。
  5. 🔍 重复问题
    • 解释:模型存在重复使用短语的问题,需要用户注意并调整设置以避免。

金句与有趣评论

  1. “😂 Lost me at ‘Thank god for creating the French’ part.”
    • 亮点:评论者对帖子中提到“感谢上帝创造了法国人”的部分表示困惑,引发了关于法国人和美国历史关系的讨论。
  2. “🤔 Yeah this might very well be the best one, haven’t tested it on that many charactercards but it did a rather complex scenario involving 3 characters rather well.”
    • 亮点:评论者认为NemoMix-Unleashed模型可能是目前最好的模型之一,特别是在处理复杂场景和多角色互动方面。
  3. “👀 The NSFW example really contains a lot of purple prose…”
    • 亮点:评论者对NSFW示例中的描述过于华丽表示看法,引发了关于性场景描述的偏好和期望的讨论。

情感分析

讨论的总体情感倾向积极,用户们对NemoMix-Unleashed模型的性能和使用体验给予了高度评价。主要分歧点在于模型的重复问题和格式选择,如Mistral Instruct格式的争议。这些分歧可能源于用户对模型性能的不同期望和技术细节的不同理解。

趋势与预测

  • 新兴话题:用户对模型的技术细节和设置调整的关注可能会引发更多关于模型优化和性能提升的讨论。
  • 潜在影响:NemoMix-Unleashed模型的推荐和讨论可能会影响其他用户的选择,推动更多用户尝试和反馈,从而促进模型的进一步优化和改进。

详细内容:

《热门 RP 模型 NemoMix-Unleashed-12B 引发 Reddit 热议》

在 Reddit 上,一篇关于新的 RP 模型 NemoMix-Unleashed-12B 的帖子引起了广泛关注。该帖子获得了众多的点赞和大量的评论。

原帖作者 Meryiel 详细介绍了这个模型,并分享了自己的使用体验和相关设置。同时,还提供了多个链接,包括模型的页面、相关的设置文件等。帖子引发了关于模型的多个方面的讨论。

讨论的焦点和观点包括: 有人对作者提到“感谢上帝创造了法国人”这部分内容表示不理解。 有用户表示会尝试这个模型。 对于模型在写作故事,包括 NSFW 内容方面的能力,以及如何使用不同的提示,用户提出了疑问。 关于模型在不同平台和设置下的表现,如在 Ollama 中的使用情况,以及在不同量化级别和缓存设置下的效果等,大家也进行了探讨。

比如,有用户表示在 16k ctx 8 位缓存下使用该模型效果不错,但作者指出在 8 位量化下质量下降虽不明显,但在更小的量化级别下会有影响。还有用户反映在使用过程中模型不遵循系统提示,而有人认为这与所使用的后端和前端有关。

在 NSFW 内容方面,对于描述的风格,大家各有看法。有人认为某些描述过于华丽,也有人认为存在中间地带,既能简洁又能保持一定的趣味性。

对于模型的评价也是多样的。有人认为它相当出色,在角色塑造、写作风格、智能表现等方面都有优势;但也有人表示遇到了一些问题,如重复模式严重,即使使用了防止重复的设置也效果不佳。

总之,Reddit 上关于 NemoMix-Unleashed-12B 模型的讨论丰富而多元,既有对其优点的肯定,也有对存在问题的探讨。这反映了大家对新模型的关注和期待,希望它能不断改进和完善,为用户带来更好的体验。