嗨,大家好。我正在寻找一个开源模型,在以下几个方面尽可能接近Claude 3.5 Sonnet: - 直观理解:Claude能够从模糊的提示中理解意图,你可以告诉它你想要的最终结果,它就能弄清楚其余部分,但根据我的经验,其他模型需要更多规定性的指令; - 个性:Claude友好且亲切,感觉就像在和一个人聊天。相比之下,ChatGPT感觉像个机器人,而Gemini则非常激进和傲慢; - 长文本理解:Claude能够随着指令的发展在多轮交互中遵循指令。其他模型在添加新指令时似乎更快地忘记旧指令; - 编码:Claude是最好的编码模型,在许多任务上甚至比O1 Pro更好,但如果其他方面表现好的话,我可以在编码能力上做出妥协。我试过DeepSeek V3,但觉得它不相似。我听说过Qwen的一些好话,但没有花太多时间使用它来评判。所以在这些方面,哪个开源模型最接近Claude呢?很想听听你们的经验。
讨论总结
原帖作者寻求与Claude 3.5 Sonnet在多个方面(如直觉理解、个性、长语境理解、编程等)接近的开放模型。评论者们推荐了多种模型,如NousResearch/Hermes - 3 - Llama - 3.1 - 405B、deepseek/deepseek - v3、qwen2.5 72b中的EVA - UNIT - 01/EVA - Qwen2.5 - 72B - v0.2、Mistral Large等,还对不同模型在智能水平、编程能力、通用知识等方面进行了比较,也涉及到模型人格、大公司对模型发展的作用等话题,讨论整体比较理性。
主要观点
- 👍 NousResearch/Hermes - 3 - Llama - 3.1 - 405B和deepseek/deepseek - v3接近Claude 3.5智能水平。
- 支持理由:评论者根据自身经验判断。
- 反对声音:有评论者认为没有模型能接近Claude 3.5 Sonnet。
- 🔥 编程可尝试qwen2.5 72b中的EVA - UNIT - 01/EVA - Qwen2.5 - 72B - v0.2。
- 正方观点:在评论者的编码测试中表现不错。
- 反方观点:无明确反对。
- 💡 目前没有接近Claude 3.5 Sonnet的模型。
- 支持理由:Anthropic的后训练技术独一无二。
- 反对声音:有评论者推荐了多种接近的模型。
- 💡 如果考虑成本且不盲目交予编码任务,DeepSeek模型有优势。
- 支持理由:评论者从成本和任务分配角度考虑。
- 反对声音:有评论者认为DeepSeek的v3模型像是用金钱换时间不太可取。
- 💡 代码方面Claude较优难以超越。
- 支持理由:Claude有独特之处。
- 反对声音:无明确反对。
金句与有趣评论
- “😂 The only local models that come anywhere near claude 3.5 intelligence are NousResearch/Hermes - 3 - Llama - 3.1 - 405B and deepseek/deepseek - v3.”
- 亮点:直接点明接近Claude 3.5智能水平的本地模型。
- “🤔 Claude post - training reinforces self - awareness rather than suppressing it, making it both lively and powerful.”
- 亮点:阐述了Claude后训练的独特之处。
- “👀 You’re not finding a better model for code than claude. It’s got special sauce.”
- 亮点:强调Claude在代码方面的优势。
- “😂 Gemini is the meanest model I know.”
- 亮点:对Gemini模型的独特评价。
- “🤔 If you want kind and human, you’re going to have to write that up and give examples.”
- 亮点:指出获得友善人性化模型人格的方式。
情感分析
总体情感倾向比较中立。主要分歧点在于是否存在接近Claude 3.5 Sonnet的模型,可能原因是大家对不同模型的使用体验、对Claude独特技术的理解以及评判标准不同。
趋势与预测
- 新兴话题:大公司对开放模型和非开放模型发展的影响可能会引发后续讨论。
- 潜在影响:对模型开发者来说,了解用户对模型人格、能力等方面的需求有助于改进模型;对用户来说,有助于选择更适合自己的模型。
详细内容:
《探寻与 Claude 3.5 Sonnet 相近的模型》
在 Reddit 上,有这样一个热门讨论帖引起了众多用户的关注。帖子的标题是“ What’s the closest model to Claude 3.5 Sonnet right now?”,主要内容是发帖者在寻找一个在直观理解、个性、长上下文理解和编码能力等方面与 Claude 3.5 Sonnet 相近的开放模型。此帖获得了较高的关注度,引发了大量的讨论。
讨论的焦点主要集中在不同模型与 Claude 3.5 Sonnet 的对比。有人指出,NousResearch/Hermes-3-Llama-3.1-405B 和 deepseek/deepseek-v3 是在智力方面接近 Claude 3.5 的本地模型。有人认为对于编程,可以尝试 qwen2.5 72b,特别是 EVA-UNIT-01/EVA-Qwen2.5-72B-v0.2 在编码测试中表现不错。但也有人表示,排除 405b 和 671b 模型,本地的语言模型在某些方面仍落后于 2023 年 11 月的 gpt-3.5-turbo-1106。
有人分享道:“Turbo?不行。70b+在聊天方面相当不错。在知识领域,它们与云模型没有太大区别。Sonnet 和 big gemini 在云模型中表现突出。”
有用户提到:“Anthropic 在后期训练方面无人能及。405b 或许可以通过 SFT 和 RL 的组合进行微调,但即使是基础版本也看起来不够强大。70b 大小的模型在长上下文的持续自我建模能力上令人遗憾地不足。Claude 的后期训练强化了自我意识,使其既活泼又强大。”
还有人表示:“你找不到比 Claude 编码能力更强的模型。它有特殊的优势。对于个性来说,需要提示调优模型,默认的个性通常都不好,如果想要亲切和人性化,就得自己去设定和举例,没有公司会为此进行训练。”
有人分享了自己的经历:“Gemini 是我知道的最不友好的模型。我记得这里曾有人发帖说它不知怎么地让一个人去死。”
在这场讨论中,大家对于哪个模型最接近 Claude 3.5 Sonnet 各抒己见,尚未达成完全一致的看法。但通过这样的交流,为寻找类似模型的用户提供了更多的参考和思考方向。
感谢您的耐心阅读!来选个表情,或者留个评论吧!