原贴链接

根据他们新的RTX Blackwell GPU架构白皮书,在DeepSeek成功使用FP8训练其最先进的V3和R1模型之后,Nvidia似乎将RTX 40和50系列GPU的FP8训练性能削减了一半。在其最初的Ada Lovelace白皮书中,附录A中的表2显示,4090在无稀疏性的FP32累加情况下具有660.6 TFlops的FP8(与FP16累加的FP8相同)。新的Blackwell论文显示,4090在FP32累加情况下FP8的性能仅为330.3 TFlops,5090仅为419 TFlops,而FP16累加的FP8为838 TFlops。在训练时FP32累加是必须的,因为FP16不具备所需的精度和动态范围。如果这不是一个错误,那就意味着Nvidia削弱了其Geforce产品线,以进一步阻止我们将其用于AI/ML训练,而且至少对于RTX 40系列来说这可能是可逆的,因为这可能是通过驱动更新实现的。这很不幸,但也并不意外,因为自Turing架构以来,Nvidia就有故意限制Geforce GPU用于AI训练的历史,而他们的Quadro和数据中心GPU仍然保持完整性能。

讨论总结

该讨论围绕Nvidia在RTX 40和50系列GPU上FP8训练性能减半这一主题展开。部分人认为这是真实发生的,可能是Nvidia为了阻止用户使用Geforce系列进行AI/ML训练;也有人质疑这一说法,认为可能是论文数据错误或从一开始性能就是如此。大家还对性能削减的实现方式、是否可起诉Nvidia、是否存在商业欺诈等进行了讨论,观点分歧较大,讨论氛围较为热烈。

主要观点

  1. 👍 可以通过下载不同版本驱动对4090进行测试来证明Nvidia是否削减性能。
    • 支持理由:如果测试结果与Nvidia的白皮书相符,就可以起诉他们。
    • 反对声音:无。
  2. 🔥 40系列未作为AI卡出售所以难以起诉Nvidia削减性能。
    • 正方观点:40系列未标明用于AI卡用途,起诉缺乏依据。
    • 反方观点:Nvidia在自己网站上明确将这些卡作为AI卡营销,削减性能指标就应承担责任。
  3. 💡 怀疑Ada Lovelace论文中关于FP8/FP16累加与FP8/FP32累加性能相同的数据是印刷错误。
    • 解释:按照常理FP8/FP32应该更低,而Blackwell论文中的数据看起来是正确的。
  4. 💡 认为性能减半可能是旧Ada论文中的错误。
    • 解释:Nvidia不能更改已发布显卡的规格,所以可能是论文数据有误。
  5. 💡 Nvidia有进行人为市场细分的习惯,削减FP8训练性能可能是一种市场策略。
    • 解释:Nvidia一贯喜欢进行人为的市场细分操作,可能与利益相关。

金句与有趣评论

  1. “😂 That’s actually pretty easy to prove, download a very old driver and a current driver and run the same tests for a 4090. If it matches nvidia’s papers then sue them.”
    • 亮点:提出了一种简单直接的方法来验证Nvidia是否削减性能。
  2. “🤔 Seems like a typo in the Ada Lovelace paper, why would fp8/fp16 accumulation be the same as fp8/fp32 accumulation?”
    • 亮点:对论文中的数据提出合理怀疑。
  3. “👀 Doubling your stated performance through a "typo" is called a fraud.”
    • 亮点:指出数据错误可能涉及欺诈。
  4. “😂 It would be hard to sue them as the 40 series is not sold as an AI card. You cannot sue them for this.”
    • 亮点:从产品销售用途的角度分析起诉的难度。
  5. “🤔 we wouldn’t be able to crowdfund some foreign developers (like chinese) to code up some firmware or something for un nerfing the consumer gpu’s?”
    • 亮点:提出一种恢复消费级GPU性能的奇特想法。

情感分析

总体情感倾向较为复杂。部分人对Nvidia削减性能的行为表示不满和质疑,认为这是Nvidia反消费者、垄断行为的体现;部分人则持怀疑态度,认为可能是数据错误导致性能看起来像是被削减;还有部分人对此事表现出不在乎的态度。主要分歧点在于性能是否真的被削减以及Nvidia是否存在不良商业行为。可能的原因是大家对Nvidia的商业策略、技术规格以及市场定位的理解和期望不同。

趋势与预测

  • 新兴话题:Nvidia削减性能是否是对开源模型的针对性攻击,以及大投资方是否施压。
  • 潜在影响:如果性能削减被证实是故意为之,可能会影响消费者对Nvidia的信任,促使更多人选择AMD等替代产品,也可能引发更多关于GPU性能公平性和商业道德的讨论。

详细内容:

标题:Nvidia 在 RTX 40 和 50 系列 GPU 上削减 FP8 训练性能引发激烈讨论

近日,Reddit 上一则关于“Nvidia cuts FP8 training performance in half on RTX 40 and 50 series GPUs”的帖子引起了广泛关注。该帖子指出,根据新的 RTX Blackwell GPU 架构白皮书,Nvidia 似乎在 RTX 40 和 50 系列 GPU 上削减了 FP8 训练性能,此前 DeepSeek 成功使用 FP8 训练了其 SOTA V3 和 R1 模型。此帖获得了众多点赞和大量评论,引发了关于 Nvidia 这一举措的多种讨论。

讨论焦点主要集中在以下几个方面: 有人认为这很容易证明,下载旧驱动和新驱动对 4090 进行相同测试,如果与 Nvidia 的白皮书相符就起诉他们。也有人觉得这可能只是白皮书中的错误。还有观点指出,由于 40 系列并非作为 AI 卡出售,起诉很难成功,Nvidia 可能会以不稳定或非预期使用可能导致损坏等理由进行辩解。

有用户提出,Nvidia 明确将这些产品作为具有 AI 能力的卡进行营销,从其官网的多个页面和宣传材料都可以看出。但也有人认为,不能因为宣传了某个功能,然后在售后秘密降低该功能就起诉,需要考虑更多因素。

特别有见地的观点如,有人认为这是 Nvidia 一贯的反消费者和垄断行为,也有人认为这可能是一个错误,或者是为了区分产品线而进行的策略。

争议点在于,Nvidia 到底是有意削减性能,还是存在错误或其他原因。支持削减性能观点的人认为,Nvidia 有这样的历史和动机。反对者则认为可能是误会或者技术问题。

共识在于大家都对 Nvidia 的这一行为表示关注和思考,认为需要更多的证据和信息来明确其真实意图。

总之,关于 Nvidia 在 RTX 40 和 50 系列 GPU 上削减 FP8 训练性能的讨论仍在继续,各方观点激烈碰撞,未来走向值得关注。