原贴链接

还曾以为我对ChatGPT 4o印象非常深刻呢。真疯狂。

讨论总结

原帖作者感觉ChatGPT 4o在使用了o1和DeepSeek一段时间后变得很愚蠢,之后众多评论者参与讨论。大家从不同角度进行分析,包括ChatGPT 4o性能下降的可能原因,如量化方式、企业为降低成本而调整等;还对比了ChatGPT 4o与其他模型,如在功能、体验、特定任务处理等方面的优劣;也涉及到对人工智能企业经营方式的看法,以及分享各自使用不同模型的体验等,整体讨论氛围热烈且观点多样。

主要观点

  1. 👍 ChatGPT 4o的表现相比之前有所下降
    • 支持理由:许多用户分享了使用ChatGPT 4o出现问题的经历,如遗漏章节、混淆信息等。
    • 反对声音:有用户认为可能是使用方式不当,也有用户觉得它在某些方面表现依然不错。
  2. 🔥 封闭模型存在用户无法知晓背后情况的弱点
    • 正方观点:封闭模型背后的操作不透明,如ChatGPT 4o性能下降用户不知原因。
    • 反方观点:无(未在评论中发现明显反方观点)。
  3. 💡 可能是采用更激进量化方式使ChatGPT 4o出现问题
    • 解释:有评论者认为采用更激进量化方式可能是导致ChatGPT 4o性能下降的原因,量化程度高的模型可能会更顽固、答案平淡等。
  4. 🤔 企业先提供高价值后偷工减料降质量以获利是常见做法
    • 解释:以ChatGPT 4o可能被削弱以降低成本为例,有人指出这是企业常见做法,用高价值吸引顾客后逐步降低质量获取利润。
  5. 😎 o3 - mini - high搜索网络功能出色
    • 解释:有用户在对比ChatGPT 4o和o3 - mini - high时指出o3 - mini - high在搜索网络方面表现很棒。

金句与有趣评论

  1. “😂 lanky_cowriter:I have a feeling after the initial launch they might start serving a heavily quantized model or nerf it in some other way to make it cheaper to serve.”
    • 亮点:提出ChatGPT 4o性能下降可能是为降低服务成本而被调整的一种推测。
  2. “🤔 GeraltOfRiga:That’s a standard corporate practice, entice customers with great value, progressively cut corners and reduce quality for the same price, make shareholders happy and profit. Enshittification to its finest.”
    • 亮点:简洁地概括了企业常见的先吸引顾客后降低质量获利的做法。
  3. “👀 SomeOddCodeGuy:I think something changed with 4o. I don’t feel like it’s gotten worse in comparison to something else; I feel like it’s gotten worse period.”
    • 亮点:强调ChatGPT 4o是自身性能变差而不是对比下显得变差。
  4. “😏 TheRealMasonMac:The API 11 - 20 is much more stable. ChatGPT - latest is plain dogshit at instruction following.”
    • 亮点:直接对比API 11 - 20和ChatGPT - latest在指令遵循方面的稳定性,表达对ChatGPT - latest的不满。
  5. “🤨 BigBlueCeiling:o1 has always been a dullard for me. I won’t use it any more because it’s such an idiot.”
    • 亮点:以一种比较诙谐的方式表达对o1的负面评价。

情感分析

总体情感倾向是对ChatGPT 4o的表现不满和质疑居多。主要分歧点在于有人认为ChatGPT 4o确实性能下降,而有人觉得可能是使用方式或者对比产生的错觉。可能的原因是大家使用场景、对模型的期望以及使用习惯等不同。例如部分用户在特定任务(如编码、设置虚拟机等)上对ChatGPT 4o有不同的体验,还有用户基于对企业经营模式的理解产生不同的看法。

趋势与预测

  • 新兴话题:关于ChatGPT 4o是否会有新的改进或者调整,以及其他模型(如5o1 mini large)的表现和发展潜力。
  • 潜在影响:如果ChatGPT 4o持续表现不佳,可能会影响用户对OpenAI的信任,促使更多用户转向其他人工智能产品或服务;同时也可能促使OpenAI对模型进行改进优化以重新获得用户信任。

详细内容:

《关于 ChatGPT 4o 表现的热门讨论》

在 Reddit 上,一篇题为“ChatGPT 4o feels straight up stupid after using o1 and DeepSeek for awhile”的帖子引发了广泛关注。该帖子表示曾经对 ChatGPT 4o 印象不错,但现在感觉其表现不佳。此帖获得了众多点赞和大量评论。

讨论的焦点主要集中在 ChatGPT 4o 性能变化的原因及影响。有人认为 4o 可能变得更差了,比如[SomeOddCodeGuy]表示感觉它不仅和其他模型相比变差了,本身就有退步。[DeltaSqueezer]则指出封闭模型的一大弱点是不透明,不知道后台发生了什么变化。[Substantial_Swan_144]认为 OpenAI 的问题不仅在于封闭,还在于缺乏透明度。

也有用户分享了个人经历,如[SomeOddCodeGuy]昨晚使用 4o 进行文档重建,结果出现了很多问题,最后换成 Qwen2.5 72b Open WebUI 实例才解决了任务。

还有一些有趣或引发思考的观点,如[coolaznkenny]提出如果未来公司都使用封闭模型处理文件,出现问题时如何进行质量检查以及如何复查一个黑箱。

对于 4o 性能的变化,大家看法不一。有人觉得是为了节省成本而进行了量化或限制,也有人认为可能只是自己的错觉或受到了安慰剂效应的影响。而[BigBlueCeiling]则认为 OpenAI 可能会根据当前负载来调整模型性能。

这场讨论充分展现了大家对 ChatGPT 4o 性能变化的关注和思考,也反映出在人工智能快速发展的背景下,用户对于模型质量和透明度的期待。