原贴链接

讨论总结

这个讨论主要围绕GPT - 4o在lmarena发布展开。话题涉及GPT - 4o的各种表现，如数学能力、创意写作能力、编码能力等，还包括与其他模型如Claude、Gemini的比较，以及模型的命名、测试、反馈等方面。在各个话题上都有不同观点，既有对GPT - 4o的认可，也有质疑和负面评价，整体讨论氛围活跃且充满争议。

主要观点

👍 不认为人们非常在意GPT - 4o的数学能力
- 支持理由：无特定解释，只是一种观点表达
- 反对声音：无
🔥 GPT - 4o在数学和困难任务方面表现更差是合理的，它更侧重于其他方面
- 正方观点：推理模型在数学等困难任务上较难超越，所以GPT - 4o侧重于写作、创造力等方面
- 反方观点：无
💡 认为GPT - 4o命名糟糕，难以理解发布的内容
- 支持理由：GPT - 4之后的命名让人不清楚发布的是什么
- 反对声音：无
🤔 在编程项目中，Claude Sonnet的领先地位令人费解
- 支持理由：根据使用经验得出此看法
- 反对声音：无
😕 怀疑GPT - 4o在创意写作方面排名第一
- 支持理由：只看到关于GPT - 4o创意写作的负面反馈
- 反对声音：认为需要正确提示GPT - 4o才能发挥其创意写作能力

金句与有趣评论

“😂 I don’t think they care about 4o’s math ability that much”
- 亮点：简洁表达对GPT - 4o数学能力不被在意的看法
“🤔 What a terrible naming they use. After gpt - 4 I literally have no idea what the fuck they are releasing.”
- 亮点：直白地指出GPT - 4o命名的糟糕之处
“👀 Based on my experience with Gemini* and o1*, I don’t understand why Claude Sonnet is streets ahead for my programming projects.”
- 亮点：基于自身经验对Claude Sonnet在编程项目中的领先地位表示疑惑
“😒 I fucking hate this fucking shit.”
- 亮点：强烈表达对GPT - 4o表情符号使用的厌恶
“🤨 my guess is that their creative writing metric is about structuring every response with nearly json - level bulletpoint spam”
- 亮点：对GPT - 4o创意写作衡量标准提出独特猜测

情感分析

总体情感倾向较为复杂，既有正面的赞同（如对GPT - 4o在问答方面的偏爱），也有负面的评价（如对GPT - 4o在创意写作方面的怀疑、对命名的不满等）。主要分歧点在于GPT - 4o的各项能力（如数学、创意写作、编码等）、命名方式以及与其他模型的比较。可能的原因是不同用户的使用场景、期望以及对不同模型的了解程度不同。

趋势与预测

新兴话题：关于DeepSeek的开源性以及模型发布的更高要求可能会引发后续讨论；Gemini和GPT - 4o的API相关话题可能会被进一步探讨。
潜在影响：对人工智能模型的发展方向可能产生影响，促使开发者更加注重模型命名的合理性、性能的提升以及与用户期望的匹配度；在市场方面，可能影响用户对不同模型的选择倾向。

详细内容：

标题：Reddit 热议 GPT-4o 引发的观点碰撞

近日，Reddit 上关于 GPT-4o 的讨论热度颇高。原帖主要围绕 GPT-4o 在数学能力、写作与创意、指令遵循等方面的表现展开，获得了众多关注，引发了大量的评论和讨论。

讨论焦点主要集中在以下几个方面：有人认为 GPT-4o 的数学能力并非重点，其重心更多在写作、创意和指令遵循上。例如，有用户分享道：“作为一名长期关注语言模型的研究者，我发现 GPT-4o 在处理复杂任务时，数学方面确实有所不足，但在写作和创意方面表现出色。这种转变或许是因为在某些任务上，现有的推理模型难以超越，所以才会有这样的调整。” 也有人对 GPT-4o 的表现持不同看法，认为其数学能力还有提升空间。比如：“在我的编程项目中，使用 GPT-4o 时，数学相关的问题处理得不够理想。” 还有用户关注 GPT-4o 在创意写作方面的表现，有人认为需要正确引导才能发挥其优势。

关于 GPT-4o 与其他模型的比较，观点各异。有人觉得 GPT-4o 在某些方面优于其他模型，比如在直问直答和编码帮助上表现出色；但也有人认为在编码方面，GPT-4o 不如 Claude-Sonnet。

在讨论中，大家对模型命名的混乱也颇有微词，觉得难以区分不同版本。

有趣的是，对于 GPT-4o 增加 emoji 使用率这一点，用户们的反应多样，有人觉得有趣，有人则表示反感。

总体而言，Reddit 上关于 GPT-4o 的讨论展现了大家对其性能、特点以及与其他模型对比的关注和思考，反映了用户对语言模型发展的期待和担忧。

讨论总结#

主要观点#

金句与有趣评论#

情感分析#

趋势与预测#

详细内容：#