原贴链接

Gemma的9b系列并不是我们唯一在研发的项目;现在推出27b-kto!

我们在新的SFT基础上进行了多次KTO训练,最终将其中表现最好的三个模型结合在一起,形成了最佳的模型。

我们还在anthracite-forge上发布了所有参与训练的候选模型,因此如果你不喜欢我们官方发布的27b-kto,你可以自行尝试SFT和KTO的训练。

希望你喜欢!一如既往地感谢大家持续的反馈和支持!

未来我们计划转向在线强化学习方法,因为仅靠离线的DPO/KTO无法完全缩小性能差距,但在此之前,这是我们能做到的最好水平!

权重和量化在这里:https://huggingface.co/collections/anthracite-org/v3-66cc37cccc47b8e6e996ef82

讨论总结

Reddit用户对新发布的“Magnum v3 - 27b KTO”模型表现出浓厚的兴趣和期待。讨论主要集中在模型的性能、选择和未来发展方向。用户们对新模型充满期待,并积极下载和测试。同时,社区中对于哪种模型更好的意见不一,有人建议尝试Anthracite-forge中的原始SFT模型。总体上,讨论氛围积极,用户对技术进步持乐观态度。

主要观点

  1. 👍 对新发布的“27b-kto”模型充满期待
    • 支持理由:用户们迫不及待地想要测试新模型,显示出对技术进步的积极态度和对新产品的浓厚兴趣。
    • 反对声音:无明显反对声音。
  2. 🔥 社区对Magnum v3 - 27b KTO模型的评价不一
    • 正方观点:有人认为官方发布的27b-kto模型表现出色。
    • 反方观点:有人建议尝试Anthracite-forge中的原始SFT模型,认为并非唯一选择。
  3. 💡 用户对“34B”模型感到失望
    • 解释:用户希望新模型能够表现出色,并提到了对“Yi base model”在英语表现上的不满。
  4. 💡 用户对新发布的“27b-kto”模型表现出浓厚的兴趣
    • 解释:用户立即将其加入下载列表,显示出对新模型的浓厚兴趣和期待。
  5. 💡 用户询问是否有计划发布Magnum-v3 12b版本
    • 解释:用户只能运行小型模型,并询问是否有计划发布Magnum-v3 12b版本。

金句与有趣评论

  1. “😂 Can’t wait to test it.”
    • 亮点:简洁明了地表达了用户对新模型的期待和兴奋之情。
  2. “🤔 If users like Magnum’s tuning, they can try some of the original SFT models on Anthracite-forge.”
    • 亮点:提供了有价值的建议,帮助用户选择适合的模型。
  3. “👀 I was a little disappointed with 34B, hopefully this is good.”
    • 亮点:表达了用户对前作的不满和对新模型的期待。
  4. “👀 put it into download list immediately :D”
    • 亮点:简洁地表达了用户对新模型的积极态度和立即行动的意愿。
  5. “👀 I can only run small models and Magnum-v2.5 12b is my favorite for RP. Thanks for this great model!”
    • 亮点:表达了用户对特定模型的喜爱和对开发者工作的认可。

情感分析

讨论的总体情感倾向积极,用户对新发布的“27b-kto”模型表现出浓厚的兴趣和期待。主要分歧点在于社区对哪种模型更好的意见不一,有人认为官方发布的27b-kto模型表现出色,也有人建议尝试Anthracite-forge中的原始SFT模型。可能的原因是用户对不同模型的性能和适用场景有不同的需求和期望。

趋势与预测

  • 新兴话题:用户对小型模型的需求可能会引发对Magnum-v3 12b版本的讨论。
  • 潜在影响:新模型的发布可能会推动相关领域的技术进步,并影响用户对未来模型发展的期待和选择。

详细内容:

标题:Magnum v3 - 27b KTO 引发热议

近日,Reddit 上一则关于“Magnum v3 - 27b KTO”的帖子引发了众多网友的关注。该帖子介绍了他们在相关领域的工作进展,称一直在对多个 KTO 进行训练,并将其中 3 个进行组合以得到表现最佳的模型。同时还表示将在 anthracite-forge 上公布所有训练的候选模型,以便大家自行试验。此贴获得了较高的关注度,引发了大量讨论。

讨论焦点与观点分析: 有人表示已经迫不及待想要测试;有人请求更新相关链接;有人立即下载;有人提到对于哪个更好存在不同意见,建议尝试 anthracite-forge 中的原始 SFT 模型;有人表示要马上加入下载列表;有人咨询关于设置系统提示的问题并得到解答;有人称正在下载;有人对 34B 有些失望,希望这次的表现出色;有人称 Magnum-v2.5 12b 是自己最喜欢的用于 RP 的模型,并询问是否计划发布 Magnum-v3 12b;还有人询问 Magnum Arena 的情况并提供了相关链接。

在这场讨论中,大家对于新模型的期待和好奇显而易见,同时也反映出不同用户在使用体验和需求上的差异。但整体上,都对新模型充满了期待,并希望能通过亲自尝试来检验其性能。