帖子仅提供了一个图片链接，无实质内容可翻译

讨论总结

这篇帖子声称DeepSeek R1比GPT 4.5好，评论主要围绕这一观点展开。讨论涉及各个模型的性能、价格、推理能力等多方面的比较，也有对OpenAI的期待和对其基准测试可信度的质疑，其中夹杂着一些诙谐幽默的观点和调侃，整体讨论比较多元且活跃。

主要观点

👍 DeepSeek R1之后新的人工智能成果不断出现
- 支持理由：评论者提到Claude Sonnet 3.7、GPT - 4.5等不断出现
- 反对声音：无
🔥 DeepSeek R1比o1和o3 - mini更贵且效果差
- 正方观点：有人通过比较认为它在价格和效果上表现不佳
- 反方观点：从任务角度看它比o1花费低且速度快
💡 GPT 4.5是比较真实的且在编码方面表现不错
- 支持理由：有评论指出在编码方面比sonnet 3.7更好
- 反对声音：无
👍 OpenAI模型的基准测试不可信
- 支持理由：自FrontierMath事件后就不可信
- 反对声音：无
💡 DeepSeek R1是新的基础模型，可在其之上构建推理模型
- 支持理由：有评论指出这一特性且很多人忽略了
- 反对声音：无

金句与有趣评论

“😂 Funnily, since deepseek - R1, we’re having Claude Sonnet 3.7, GPT - 4.5, etc.”
- 亮点：诙谐地指出人工智能领域新成果不断出现的现象
“🤔 You all are missing the point. It’s a not - reasoning LLM, so its much faster than o1, o3 - mini, R1, etc.”
- 亮点：提出一种不推理但速度快的LLM概念
“👀 I am impressed with o3 - mini - high, it’s genuinely intelligent at a deeper level.”
- 亮点：表达对o3 - mini - high深层次智能的认可
“😂 Bold of you to assume the stem grad gets 100% lol”
- 亮点：以幽默方式反驳标题中的假设
“🤔 It’s a new base model. You can build reasoning models on top of it.”
- 亮点：指出DeepSeek R1可作为构建推理模型的新基础模型

情感分析

总体情感倾向较为复杂。既有对DeepSeek R1的认可和看好，也有对其价格和效果的质疑；对GPT 4.5有认为其表现不错的，也有质疑OpenAI基准测试可信度的。主要分歧点在于各个模型的性能、价格以及对OpenAI相关情况的看法。可能的原因是不同用户的使用体验、对模型评判标准的差异以及对不同品牌的期待值不同。

趋势与预测

新兴话题：在模型上构建推理模型可能需要的隐藏费用。
潜在影响：可能促使更多人关注模型构建中的隐藏成本，对人工智能模型的开发和商业应用产生影响。

详细内容：

标题：关于 DeepSeek R1 与 GPT 4.5 孰优孰劣的热门讨论

近日，Reddit 上一篇题为“ Its ARC-AGI | DeepSeek R1 是比 GPT 4.5 更好”的帖子引发了广泛关注，获得了众多点赞和大量评论。帖子主要围绕 DeepSeek R1 与 GPT 4.5 等模型的性能、价格和应用场景展开了激烈讨论。

在讨论中，有人指出，自 DeepSeek R1 出现后，市场上有了 Claude Sonnet 3.7、GPT-4.5 等多种选择，这仿佛是一场竞赛。有人认为，DeepSeek R1 不是推理型语言模型，所以速度更快，但价格昂贵，因为它无需思考一分钟来回答问题，这在一些需要快速回答的实时任务中很有用，不过最终可能比其他模型更便宜。也有人表示，较低的延迟是以更差的答案和更高的成本为代价的，这是一种艰难的权衡。还有人质疑，真正需要即时回答的任务到底有多少，而且快速但错误的答案并无帮助。有人提到，基本上任何客户服务聊天或语音任务都需要即时回答模式，而某些模型在这方面目前还无用。

有人提出，为创建大量合成数据，DeepSeek R1 有其作用。也有人指出，对于任何困难任务，如果不要求模型逐步思考，就会得到错误答案，任何非推理模型都是如此。还有人好奇，每秒 16 个令牌的速度算快吗？

有人认为 DeepSeek R1 比 o1 和 o3-mini 更贵更差，质疑其存在的目标。但也有人表示，图表显示在某些任务上它实际上比 o1 更便宜，尽管输出成本更高，但由于在思考上不花费令牌，实际使用中更便宜，不过价格仍不合理。

有人认为这是一个新的基础模型，想看看原始 GPT-4 的位置和前沿 GPT 4o 的情况。有人对 o3-mini-high 印象深刻，认为它在更深层次上表现出真正的智能。也有人认为 OpenAI 模型的基准测试不可信。

总之，关于 DeepSeek R1 与 GPT 4.5 等模型的讨论呈现出多样性和复杂性，涉及性能、价格、应用场景等多个方面，各方观点激烈碰撞，尚无明确的定论。

讨论总结#

主要观点#

金句与有趣评论#

情感分析#

趋势与预测#

详细内容：#