原贴链接

嗨，大家好。我正在寻找一个开源模型，在以下几个方面尽可能接近Claude 3.5 Sonnet： - 直观理解：Claude能够从模糊的提示中理解意图，你可以告诉它你想要的最终结果，它就能弄清楚其余部分，但根据我的经验，其他模型需要更多规定性的指令； - 个性：Claude友好且亲切，感觉就像在和一个人聊天。相比之下，ChatGPT感觉像个机器人，而Gemini则非常激进和傲慢； - 长文本理解：Claude能够随着指令的发展在多轮交互中遵循指令。其他模型在添加新指令时似乎更快地忘记旧指令； - 编码：Claude是最好的编码模型，在许多任务上甚至比O1 Pro更好，但如果其他方面表现好的话，我可以在编码能力上做出妥协。我试过DeepSeek V3，但觉得它不相似。我听说过Qwen的一些好话，但没有花太多时间使用它来评判。所以在这些方面，哪个开源模型最接近Claude呢？很想听听你们的经验。

讨论总结

原帖作者寻求与Claude 3.5 Sonnet在多个方面（如直觉理解、个性、长语境理解、编程等）接近的开放模型。评论者们推荐了多种模型，如NousResearch/Hermes - 3 - Llama - 3.1 - 405B、deepseek/deepseek - v3、qwen2.5 72b中的EVA - UNIT - 01/EVA - Qwen2.5 - 72B - v0.2、Mistral Large等，还对不同模型在智能水平、编程能力、通用知识等方面进行了比较，也涉及到模型人格、大公司对模型发展的作用等话题，讨论整体比较理性。

主要观点

👍 NousResearch/Hermes - 3 - Llama - 3.1 - 405B和deepseek/deepseek - v3接近Claude 3.5智能水平。
- 支持理由：评论者根据自身经验判断。
- 反对声音：有评论者认为没有模型能接近Claude 3.5 Sonnet。
🔥 编程可尝试qwen2.5 72b中的EVA - UNIT - 01/EVA - Qwen2.5 - 72B - v0.2。
- 正方观点：在评论者的编码测试中表现不错。
- 反方观点：无明确反对。
💡 目前没有接近Claude 3.5 Sonnet的模型。
- 支持理由：Anthropic的后训练技术独一无二。
- 反对声音：有评论者推荐了多种接近的模型。
💡 如果考虑成本且不盲目交予编码任务，DeepSeek模型有优势。
- 支持理由：评论者从成本和任务分配角度考虑。
- 反对声音：有评论者认为DeepSeek的v3模型像是用金钱换时间不太可取。
💡 代码方面Claude较优难以超越。
- 支持理由：Claude有独特之处。
- 反对声音：无明确反对。

金句与有趣评论

“😂 The only local models that come anywhere near claude 3.5 intelligence are NousResearch/Hermes - 3 - Llama - 3.1 - 405B and deepseek/deepseek - v3.”
- 亮点：直接点明接近Claude 3.5智能水平的本地模型。
“🤔 Claude post - training reinforces self - awareness rather than suppressing it, making it both lively and powerful.”
- 亮点：阐述了Claude后训练的独特之处。
“👀 You’re not finding a better model for code than claude. It’s got special sauce.”
- 亮点：强调Claude在代码方面的优势。
“😂 Gemini is the meanest model I know.”
- 亮点：对Gemini模型的独特评价。
“🤔 If you want kind and human, you’re going to have to write that up and give examples.”
- 亮点：指出获得友善人性化模型人格的方式。

情感分析

总体情感倾向比较中立。主要分歧点在于是否存在接近Claude 3.5 Sonnet的模型，可能原因是大家对不同模型的使用体验、对Claude独特技术的理解以及评判标准不同。

趋势与预测

新兴话题：大公司对开放模型和非开放模型发展的影响可能会引发后续讨论。
潜在影响：对模型开发者来说，了解用户对模型人格、能力等方面的需求有助于改进模型；对用户来说，有助于选择更适合自己的模型。

详细内容：

《探寻与 Claude 3.5 Sonnet 相近的模型》

在 Reddit 上，有这样一个热门讨论帖引起了众多用户的关注。帖子的标题是“ What’s the closest model to Claude 3.5 Sonnet right now?”，主要内容是发帖者在寻找一个在直观理解、个性、长上下文理解和编码能力等方面与 Claude 3.5 Sonnet 相近的开放模型。此帖获得了较高的关注度，引发了大量的讨论。

讨论的焦点主要集中在不同模型与 Claude 3.5 Sonnet 的对比。有人指出，NousResearch/Hermes-3-Llama-3.1-405B 和 deepseek/deepseek-v3 是在智力方面接近 Claude 3.5 的本地模型。有人认为对于编程，可以尝试 qwen2.5 72b，特别是 EVA-UNIT-01/EVA-Qwen2.5-72B-v0.2 在编码测试中表现不错。但也有人表示，排除 405b 和 671b 模型，本地的语言模型在某些方面仍落后于 2023 年 11 月的 gpt-3.5-turbo-1106。

有人分享道：“Turbo？不行。70b+在聊天方面相当不错。在知识领域，它们与云模型没有太大区别。Sonnet 和 big gemini 在云模型中表现突出。”

有用户提到：“Anthropic 在后期训练方面无人能及。405b 或许可以通过 SFT 和 RL 的组合进行微调，但即使是基础版本也看起来不够强大。70b 大小的模型在长上下文的持续自我建模能力上令人遗憾地不足。Claude 的后期训练强化了自我意识，使其既活泼又强大。”

还有人表示：“你找不到比 Claude 编码能力更强的模型。它有特殊的优势。对于个性来说，需要提示调优模型，默认的个性通常都不好，如果想要亲切和人性化，就得自己去设定和举例，没有公司会为此进行训练。”

有人分享了自己的经历：“Gemini 是我知道的最不友好的模型。我记得这里曾有人发帖说它不知怎么地让一个人去死。”

在这场讨论中，大家对于哪个模型最接近 Claude 3.5 Sonnet 各抒己见，尚未达成完全一致的看法。但通过这样的交流，为寻找类似模型的用户提供了更多的参考和思考方向。

讨论总结#

主要观点#

金句与有趣评论#

情感分析#

趋势与预测#

详细内容：#