讨论总结

本次讨论主要围绕Hermes 3模型的多个方面进行，包括技术进展、计算成本、模型性能、指令遵循、用户体验等。评论者们对模型的不同版本进行了比较，讨论了其在不同任务上的表现，如AGIEval、ARC-C、BoolQ等。同时，也有关于模型是否真正“无审查”和“解锁”的讨论，以及如何通过调整系统提示来“越狱”模型。此外，用户分享了个人使用经验，对模型的响应和性能提出了具体看法。总体上，讨论氛围偏向技术分析和实际应用探讨，涉及多个技术细节和用户体验问题。

主要观点

👍 405b rp fine-tune的实现速度超出预期
- 支持理由：评论者分享了405b rp fine-tune的实现经验，认为其速度超出预期。
- 反对声音：无明显反对声音。
🔥 计算资源成本正在下降
- 正方观点：评论者普遍认为计算资源成本正在下降，消费者可以以较低的价格租用高性能显卡。
- 反方观点：无明显反方观点。
💡 Hermes 3模型在创意写作上表现较好，但在色情内容处理上表现不佳
- 解释：用户对Hermes 3.1 8b版本进行了详细测试，指出其在创意写作方面表现较好，但在色情内容处理上表现不佳。
🌟 Hermes 3模型并非真正无审查，仍存在一定程度的限制
- 解释：评论者指出，尽管模型声称是无审查和解锁的，但实际上仍然存在一定程度的审查和限制。
🚀 通过特定的设置（如chatML模式）可以改善模型的响应
- 解释：用户分享了通过特定设置改善模型响应的经验，推荐尝试其他模型如Midnight Miqu 103b和Mistral large 2。

金句与有趣评论

“😂 And people said that we will never get 405b rp fine-tunes… Now we already have several, and not much time has passed.”
- 亮点：反映了技术进展的快速和社区的积极响应。
“🤔 Can someone please explain to me what is meant by a steerable model? Thanks”
- 亮点：提出了对“steerable model”概念的疑问，引发进一步的技术讨论。
“👀 Not uncensored, nor "unlocked", whatever that means.”
- 亮点：对模型的“无审查”和“解锁”特性表示质疑，引发对模型实际表现的讨论。

情感分析

讨论的总体情感倾向偏向中立，主要集中在技术分析和实际应用探讨上。主要分歧点在于对模型是否真正“无审查”和“解锁”的看法，以及模型在不同任务上的表现。可能的原因包括技术细节的理解差异和实际应用中的体验差异。

趋势与预测

新兴话题：模型在不同任务上的表现和优化，以及如何通过特定设置改善模型响应。
潜在影响：对模型性能和用户体验的持续关注可能会推动技术改进和应用优化。

详细内容：

标题：关于 Hermes 3 模型的热门讨论

近日，Reddit 上关于 Hermes 3 模型的讨论十分热烈。原帖主要围绕 Hermes 3 模型在多个任务上的表现，以及其所谓的“解锁、未审查和可操控”的特点展开。该帖子获得了众多关注，评论数众多，引发了广泛的讨论。

讨论的焦点集中在 Hermes 3 模型是否真的如宣传的那样未审查和可操控。有人认为现在已经有了 405b 的精细调整，计算成本在降低，比如可以按较低价格租用 3090 或 4090 显卡。但也有人指出 4090 租用价格没那么低。

有用户询问可操控模型的含义。有人解释说这意味着它善于遵循系统提示。但也有人表示自己的体验并不好，觉得它根本不按指令行事，还不如基础的 Llama 3.1 70B 模型。

关于未审查这一特点，存在诸多争议。有人认为它并非真正未审查，还是存在很多拒绝和限制。比如有用户测试后发现它在某些方面的表现和原始模型一样，会拒绝一些请求。有人指出即使是基础模型，其训练数据可能也存在审查和偏差。还有人认为完全未审查意味着使用原始未经任何调整的模型文件。

也有用户分享了自己的测试体验，比如 [-Ellary-] 表示它在写创意故事方面更有创意，但在某些方面表现不佳，如写色情内容、遵循指令和编码等。

在这场讨论中，大家对于 Hermes 3 模型的特点和表现看法不一。有人期待更强大的模型出现，有人认为现有的模型存在诸多问题，需要改进。但无论如何，这场讨论让人们对模型的性能和特点有了更深入的思考。

讨论总结#

主要观点#

金句与有趣评论#

情感分析#

趋势与预测#

详细内容：#