原贴链接

image

讨论总结

本次讨论主要围绕Hermes 3模型的多个方面进行,包括技术进展、计算成本、模型性能、指令遵循、用户体验等。评论者们对模型的不同版本进行了比较,讨论了其在不同任务上的表现,如AGIEval、ARC-C、BoolQ等。同时,也有关于模型是否真正“无审查”和“解锁”的讨论,以及如何通过调整系统提示来“越狱”模型。此外,用户分享了个人使用经验,对模型的响应和性能提出了具体看法。总体上,讨论氛围偏向技术分析和实际应用探讨,涉及多个技术细节和用户体验问题。

主要观点

  1. 👍 405b rp fine-tune的实现速度超出预期
    • 支持理由:评论者分享了405b rp fine-tune的实现经验,认为其速度超出预期。
    • 反对声音:无明显反对声音。
  2. 🔥 计算资源成本正在下降
    • 正方观点:评论者普遍认为计算资源成本正在下降,消费者可以以较低的价格租用高性能显卡。
    • 反方观点:无明显反方观点。
  3. 💡 Hermes 3模型在创意写作上表现较好,但在色情内容处理上表现不佳
    • 解释:用户对Hermes 3.1 8b版本进行了详细测试,指出其在创意写作方面表现较好,但在色情内容处理上表现不佳。
  4. 🌟 Hermes 3模型并非真正无审查,仍存在一定程度的限制
    • 解释:评论者指出,尽管模型声称是无审查和解锁的,但实际上仍然存在一定程度的审查和限制。
  5. 🚀 通过特定的设置(如chatML模式)可以改善模型的响应
    • 解释:用户分享了通过特定设置改善模型响应的经验,推荐尝试其他模型如Midnight Miqu 103b和Mistral large 2。

金句与有趣评论

  1. “😂 And people said that we will never get 405b rp fine-tunes… Now we already have several, and not much time has passed.”
    • 亮点:反映了技术进展的快速和社区的积极响应。
  2. “🤔 Can someone please explain to me what is meant by a steerable model? Thanks”
    • 亮点:提出了对“steerable model”概念的疑问,引发进一步的技术讨论。
  3. “👀 Not uncensored, nor "unlocked", whatever that means.”
    • 亮点:对模型的“无审查”和“解锁”特性表示质疑,引发对模型实际表现的讨论。

情感分析

讨论的总体情感倾向偏向中立,主要集中在技术分析和实际应用探讨上。主要分歧点在于对模型是否真正“无审查”和“解锁”的看法,以及模型在不同任务上的表现。可能的原因包括技术细节的理解差异和实际应用中的体验差异。

趋势与预测

  • 新兴话题:模型在不同任务上的表现和优化,以及如何通过特定设置改善模型响应。
  • 潜在影响:对模型性能和用户体验的持续关注可能会推动技术改进和应用优化。

详细内容:

标题:关于 Hermes 3 模型的热门讨论

近日,Reddit 上关于 Hermes 3 模型的讨论十分热烈。原帖主要围绕 Hermes 3 模型在多个任务上的表现,以及其所谓的“解锁、未审查和可操控”的特点展开。该帖子获得了众多关注,评论数众多,引发了广泛的讨论。

讨论的焦点集中在 Hermes 3 模型是否真的如宣传的那样未审查和可操控。有人认为现在已经有了 405b 的精细调整,计算成本在降低,比如可以按较低价格租用 3090 或 4090 显卡。但也有人指出 4090 租用价格没那么低。

有用户询问可操控模型的含义。有人解释说这意味着它善于遵循系统提示。但也有人表示自己的体验并不好,觉得它根本不按指令行事,还不如基础的 Llama 3.1 70B 模型。

关于未审查这一特点,存在诸多争议。有人认为它并非真正未审查,还是存在很多拒绝和限制。比如有用户测试后发现它在某些方面的表现和原始模型一样,会拒绝一些请求。有人指出即使是基础模型,其训练数据可能也存在审查和偏差。还有人认为完全未审查意味着使用原始未经任何调整的模型文件。

也有用户分享了自己的测试体验,比如 [-Ellary-] 表示它在写创意故事方面更有创意,但在某些方面表现不佳,如写色情内容、遵循指令和编码等。

在这场讨论中,大家对于 Hermes 3 模型的特点和表现看法不一。有人期待更强大的模型出现,有人认为现有的模型存在诸多问题,需要改进。但无论如何,这场讨论让人们对模型的性能和特点有了更深入的思考。