原贴链接

帖子仅提供了一个图片链接,无实质内容可翻译

讨论总结

这篇帖子声称DeepSeek R1比GPT 4.5好,评论主要围绕这一观点展开。讨论涉及各个模型的性能、价格、推理能力等多方面的比较,也有对OpenAI的期待和对其基准测试可信度的质疑,其中夹杂着一些诙谐幽默的观点和调侃,整体讨论比较多元且活跃。

主要观点

  1. 👍 DeepSeek R1之后新的人工智能成果不断出现
    • 支持理由:评论者提到Claude Sonnet 3.7、GPT - 4.5等不断出现
    • 反对声音:无
  2. 🔥 DeepSeek R1比o1和o3 - mini更贵且效果差
    • 正方观点:有人通过比较认为它在价格和效果上表现不佳
    • 反方观点:从任务角度看它比o1花费低且速度快
  3. 💡 GPT 4.5是比较真实的且在编码方面表现不错
    • 支持理由:有评论指出在编码方面比sonnet 3.7更好
    • 反对声音:无
  4. 👍 OpenAI模型的基准测试不可信
    • 支持理由:自FrontierMath事件后就不可信
    • 反对声音:无
  5. 💡 DeepSeek R1是新的基础模型,可在其之上构建推理模型
    • 支持理由:有评论指出这一特性且很多人忽略了
    • 反对声音:无

金句与有趣评论

  1. “😂 Funnily, since deepseek - R1, we’re having Claude Sonnet 3.7, GPT - 4.5, etc.”
    • 亮点:诙谐地指出人工智能领域新成果不断出现的现象
  2. “🤔 You all are missing the point. It’s a not - reasoning LLM, so its much faster than o1, o3 - mini, R1, etc.”
    • 亮点:提出一种不推理但速度快的LLM概念
  3. “👀 I am impressed with o3 - mini - high, it’s genuinely intelligent at a deeper level.”
    • 亮点:表达对o3 - mini - high深层次智能的认可
  4. “😂 Bold of you to assume the stem grad gets 100% lol”
    • 亮点:以幽默方式反驳标题中的假设
  5. “🤔 It’s a new base model. You can build reasoning models on top of it.”
    • 亮点:指出DeepSeek R1可作为构建推理模型的新基础模型

情感分析

总体情感倾向较为复杂。既有对DeepSeek R1的认可和看好,也有对其价格和效果的质疑;对GPT 4.5有认为其表现不错的,也有质疑OpenAI基准测试可信度的。主要分歧点在于各个模型的性能、价格以及对OpenAI相关情况的看法。可能的原因是不同用户的使用体验、对模型评判标准的差异以及对不同品牌的期待值不同。

趋势与预测

  • 新兴话题:在模型上构建推理模型可能需要的隐藏费用。
  • 潜在影响:可能促使更多人关注模型构建中的隐藏成本,对人工智能模型的开发和商业应用产生影响。

详细内容:

标题:关于 DeepSeek R1 与 GPT 4.5 孰优孰劣的热门讨论

近日,Reddit 上一篇题为“ Its ARC-AGI | DeepSeek R1 是比 GPT 4.5 更好”的帖子引发了广泛关注,获得了众多点赞和大量评论。帖子主要围绕 DeepSeek R1 与 GPT 4.5 等模型的性能、价格和应用场景展开了激烈讨论。

在讨论中,有人指出,自 DeepSeek R1 出现后,市场上有了 Claude Sonnet 3.7、GPT-4.5 等多种选择,这仿佛是一场竞赛。有人认为,DeepSeek R1 不是推理型语言模型,所以速度更快,但价格昂贵,因为它无需思考一分钟来回答问题,这在一些需要快速回答的实时任务中很有用,不过最终可能比其他模型更便宜。也有人表示,较低的延迟是以更差的答案和更高的成本为代价的,这是一种艰难的权衡。还有人质疑,真正需要即时回答的任务到底有多少,而且快速但错误的答案并无帮助。有人提到,基本上任何客户服务聊天或语音任务都需要即时回答模式,而某些模型在这方面目前还无用。

有人提出,为创建大量合成数据,DeepSeek R1 有其作用。也有人指出,对于任何困难任务,如果不要求模型逐步思考,就会得到错误答案,任何非推理模型都是如此。还有人好奇,每秒 16 个令牌的速度算快吗?

有人认为 DeepSeek R1 比 o1 和 o3-mini 更贵更差,质疑其存在的目标。但也有人表示,图表显示在某些任务上它实际上比 o1 更便宜,尽管输出成本更高,但由于在思考上不花费令牌,实际使用中更便宜,不过价格仍不合理。

有人认为这是一个新的基础模型,想看看原始 GPT-4 的位置和前沿 GPT 4o 的情况。有人对 o3-mini-high 印象深刻,认为它在更深层次上表现出真正的智能。也有人认为 OpenAI 模型的基准测试不可信。

总之,关于 DeepSeek R1 与 GPT 4.5 等模型的讨论呈现出多样性和复杂性,涉及性能、价格、应用场景等多个方面,各方观点激烈碰撞,尚无明确的定论。