原贴链接

根据他们新的RTX Blackwell GPU架构白皮书，在DeepSeek成功使用FP8训练其最先进的V3和R1模型之后，Nvidia似乎将RTX 40和50系列GPU的FP8训练性能削减了一半。在其最初的Ada Lovelace白皮书中，附录A中的表2显示，4090在无稀疏性的FP32累加情况下具有660.6 TFlops的FP8（与FP16累加的FP8相同）。新的Blackwell论文显示，4090在FP32累加情况下FP8的性能仅为330.3 TFlops，5090仅为419 TFlops，而FP16累加的FP8为838 TFlops。在训练时FP32累加是必须的，因为FP16不具备所需的精度和动态范围。如果这不是一个错误，那就意味着Nvidia削弱了其Geforce产品线，以进一步阻止我们将其用于AI/ML训练，而且至少对于RTX 40系列来说这可能是可逆的，因为这可能是通过驱动更新实现的。这很不幸，但也并不意外，因为自Turing架构以来，Nvidia就有故意限制Geforce GPU用于AI训练的历史，而他们的Quadro和数据中心GPU仍然保持完整性能。

讨论总结

该讨论围绕Nvidia在RTX 40和50系列GPU上FP8训练性能减半这一主题展开。部分人认为这是真实发生的，可能是Nvidia为了阻止用户使用Geforce系列进行AI/ML训练；也有人质疑这一说法，认为可能是论文数据错误或从一开始性能就是如此。大家还对性能削减的实现方式、是否可起诉Nvidia、是否存在商业欺诈等进行了讨论，观点分歧较大，讨论氛围较为热烈。

主要观点

👍 可以通过下载不同版本驱动对4090进行测试来证明Nvidia是否削减性能。
- 支持理由：如果测试结果与Nvidia的白皮书相符，就可以起诉他们。
- 反对声音：无。
🔥 40系列未作为AI卡出售所以难以起诉Nvidia削减性能。
- 正方观点：40系列未标明用于AI卡用途，起诉缺乏依据。
- 反方观点：Nvidia在自己网站上明确将这些卡作为AI卡营销，削减性能指标就应承担责任。
💡 怀疑Ada Lovelace论文中关于FP8/FP16累加与FP8/FP32累加性能相同的数据是印刷错误。
- 解释：按照常理FP8/FP32应该更低，而Blackwell论文中的数据看起来是正确的。
💡 认为性能减半可能是旧Ada论文中的错误。
- 解释：Nvidia不能更改已发布显卡的规格，所以可能是论文数据有误。
💡 Nvidia有进行人为市场细分的习惯，削减FP8训练性能可能是一种市场策略。
- 解释：Nvidia一贯喜欢进行人为的市场细分操作，可能与利益相关。

金句与有趣评论

“😂 That’s actually pretty easy to prove, download a very old driver and a current driver and run the same tests for a 4090. If it matches nvidia’s papers then sue them.”
- 亮点：提出了一种简单直接的方法来验证Nvidia是否削减性能。
“🤔 Seems like a typo in the Ada Lovelace paper, why would fp8/fp16 accumulation be the same as fp8/fp32 accumulation?”
- 亮点：对论文中的数据提出合理怀疑。
“👀 Doubling your stated performance through a "typo" is called a fraud.”
- 亮点：指出数据错误可能涉及欺诈。
“😂 It would be hard to sue them as the 40 series is not sold as an AI card. You cannot sue them for this.”
- 亮点：从产品销售用途的角度分析起诉的难度。
“🤔 we wouldn’t be able to crowdfund some foreign developers (like chinese) to code up some firmware or something for un nerfing the consumer gpu’s?”
- 亮点：提出一种恢复消费级GPU性能的奇特想法。

情感分析

总体情感倾向较为复杂。部分人对Nvidia削减性能的行为表示不满和质疑，认为这是Nvidia反消费者、垄断行为的体现；部分人则持怀疑态度，认为可能是数据错误导致性能看起来像是被削减；还有部分人对此事表现出不在乎的态度。主要分歧点在于性能是否真的被削减以及Nvidia是否存在不良商业行为。可能的原因是大家对Nvidia的商业策略、技术规格以及市场定位的理解和期望不同。

趋势与预测

新兴话题：Nvidia削减性能是否是对开源模型的针对性攻击，以及大投资方是否施压。
潜在影响：如果性能削减被证实是故意为之，可能会影响消费者对Nvidia的信任，促使更多人选择AMD等替代产品，也可能引发更多关于GPU性能公平性和商业道德的讨论。

详细内容：

标题：Nvidia 在 RTX 40 和 50 系列 GPU 上削减 FP8 训练性能引发激烈讨论

近日，Reddit 上一则关于“Nvidia cuts FP8 training performance in half on RTX 40 and 50 series GPUs”的帖子引起了广泛关注。该帖子指出，根据新的 RTX Blackwell GPU 架构白皮书，Nvidia 似乎在 RTX 40 和 50 系列 GPU 上削减了 FP8 训练性能，此前 DeepSeek 成功使用 FP8 训练了其 SOTA V3 和 R1 模型。此帖获得了众多点赞和大量评论，引发了关于 Nvidia 这一举措的多种讨论。

讨论焦点主要集中在以下几个方面：有人认为这很容易证明，下载旧驱动和新驱动对 4090 进行相同测试，如果与 Nvidia 的白皮书相符就起诉他们。也有人觉得这可能只是白皮书中的错误。还有观点指出，由于 40 系列并非作为 AI 卡出售，起诉很难成功，Nvidia 可能会以不稳定或非预期使用可能导致损坏等理由进行辩解。

有用户提出，Nvidia 明确将这些产品作为具有 AI 能力的卡进行营销，从其官网的多个页面和宣传材料都可以看出。但也有人认为，不能因为宣传了某个功能，然后在售后秘密降低该功能就起诉，需要考虑更多因素。

特别有见地的观点如，有人认为这是 Nvidia 一贯的反消费者和垄断行为，也有人认为这可能是一个错误，或者是为了区分产品线而进行的策略。

争议点在于，Nvidia 到底是有意削减性能，还是存在错误或其他原因。支持削减性能观点的人认为，Nvidia 有这样的历史和动机。反对者则认为可能是误会或者技术问题。

共识在于大家都对 Nvidia 的这一行为表示关注和思考，认为需要更多的证据和信息来明确其真实意图。

总之，关于 Nvidia 在 RTX 40 和 50 系列 GPU 上削减 FP8 训练性能的讨论仍在继续，各方观点激烈碰撞，未来走向值得关注。

讨论总结#

主要观点#

金句与有趣评论#

情感分析#

趋势与预测#

详细内容：#