原贴链接

Deepseek V3。[https://x.com/lmarena_ai/status/1873695386323566638]。仅耗时1.5年。ChatGPT4于2023年3月14日(圆周率日)发布。

讨论总结

整个讨论围绕着是否有开源模型能超越ChatGPT4展开。参与者提及了多个模型,如Deepseek V3、Llama系列、Qwen2.5等,对它们的推理能力、运行硬件要求、是否开源可下载等进行了探讨。大家的观点存在分歧,有认为已经有模型超越ChatGPT4的,也有持怀疑态度的,同时还涉及到对模型的各种评价以及对开源模型发展方向的看法等。

主要观点

  1. 👍 有模型已经超越了原始的GPT4
    • 支持理由:如Llama 405b在某些方面可能已经超越原始gpt4,Qwen2.5相关版本在编码和MMLU分数方面早已击败GPT - 4。
    • 反对声音:部分人认为GPT - 4经过多次升级,不同时期有很大差异,或者觉得新模型存在各种问题,并不认可超越之说。
  2. 🔥 对新开源模型持怀疑态度
    • 正方观点:很多在基准测试表现好的模型实际并不实用,一些新模型可能存在如许可证、数据使用、过度训练等问题。
    • 反方观点:像Deepseek V3在某些方面有不错的表现,如有人称OpenWebUI / Apollo与Deepseek v3组合速度快、更智能且便宜很多。
  3. 💡 不同模型各有优劣
    • 解释:例如有人觉得Sonnet在特定条件下令人印象深刻,Claude Sonnet 3.5在某些方面优于GPT4原始版本,但也有人指出Deepseek V3在创意写作方面表现不佳等。
  4. 👍 开源是发展方向
    • 支持理由:开源能够让更多人参与改进,推动世界进步。
    • 反对声音:目前一些开源模型还存在如硬件门槛高、性能不如预期等问题。
  5. 🔥 对模型的硬件要求较高
    • 正方观点:运行DeepSeek V3的GGUF版本需要特定的硬件配置,一些大模型对硬件要求高。
    • 反方观点:部分人觉得硬件要求过高限制了模型的使用和推广。

金句与有趣评论

  1. “😂 Now i want open source to release o1 mini level reasoning model \nHope”
    • 亮点:直接表达对开源模型的期待,希望有特定推理能力级别的模型发布。
  2. “🤔 We beat that a long time ago? Llama 405b beats original gpt4”
    • 亮点:提出Llama 405b可能早已超越原始gpt4的观点,引发后续关于模型对比的讨论。
  3. “👀 4o is just…enthusiastically wrong, like a child genius. Deepseek is robotic, it’s hard to steer it towards the right solution/mindset sometimes.”
    • 亮点:形象地描述了不同模型的特点,对模型的表现进行了有趣的评价。
  4. “😂 I think most of us are looking back at GPT4 with slightly rose tinted glasses, remembering what it got right and not what it got wrong.”
    • 亮点:指出大家可能对GPT4存在高估的情况,从新的角度看待GPT4的性能。
  5. “🤔 Claude sonnet 3.5 is unambiguously better than GPT4 original, and it’s smarter in its tone too (eg. Better able to take feedback and weave it into the conversation, speaks in a less condescending “educator” tone while still being authoritative, etc.)”
    • 亮点:详细对比了Claude sonnet 3.5和GPT4原始版本,从多个角度阐述前者的优势。

情感分析

总体情感倾向较为复杂,既有对新开源模型的期待和认可,也有怀疑和否定。主要分歧点在于新模型是否真的超越了ChatGPT4以及开源模型是否存在如性能、数据使用、硬件要求等问题。可能的原因是不同用户使用模型的场景、对模型的需求以及对模型评价的标准不同。

趋势与预测

  • 新兴话题:开源模型的隐私和许可证问题、模型在特定功能(如创意写作)方面的改进、如何降低模型运行的硬件门槛。
  • 潜在影响:如果开源模型能够解决现有的问题,如性能提升、硬件要求降低、隐私保障等,可能会对人工智能领域的发展格局产生影响,促使更多人选择开源模型,推动开源社区的发展,也可能会对闭源模型提供商造成竞争压力。

详细内容:

标题:Reddit 热议开源模型能否超越 ChatGPT4

在 Reddit 上,一则关于“何时会出现比 ChatGPT4 更好的开源模型”的帖子引发了广泛讨论。该帖子提到了 Deepseek V3 ,并附上了相关链接https://x.com/lmarena_ai/status/1873695386323566638 ,表示仅用 1.75 年就实现了这一目标。此贴获得了众多关注,评论数众多。

讨论的焦点主要集中在不同模型的性能比较。有人认为 Deepseek 的推理模型表现更好,也有人通过实际测试指出其存在陷入推理循环并给出错误答案的情况。还有用户分享了自己在使用其他模型如 Claude Sonnet 3.5 时的感受,认为其在某些方面优于 GPT4 原始版本。

在显卡方面,对于 3090 和 4090 的散热和功耗问题,大家争论不休。有人认为 4090 在相同功率下性能更优,但也有人指出 3090 在特定情况下散热和功耗表现更好。

关于开源模型能否在本地运行,不同用户也有不同看法。有人认为需要极高的硬件配置,也有人期待未来能在个人电脑上运行。

特别有见地的观点如有人通过让模型生成诗歌来测试其能力,发现 Claude Sonnet 3.5 表现最佳。

然而,讨论中也存在争议和分歧。有人质疑 Deepseek 的许可证问题,担心数据被用于训练。还有人对开源模型与某些国家的关系提出了看法。

总之,这次讨论展现了大家对开源模型发展的关注和思考,也反映了不同观点之间的激烈碰撞。未来开源模型能否真正超越闭源模型,并在更广泛的领域得到应用,还有待进一步观察。