尽管前两代能效有大幅提升,但英伟达这次失策了。它仅靠更高的显存容量和显著更高的内存带宽来弥补。
显卡 | RTX TITAN | 3090 | 4090 | 5090 |
---|---|---|---|---|
半精度浮点运算(FP16 TFLOPS) | 65.25 | 142.32 | 330.4 | 419.01 |
热设计功耗(TDP) | 280W | 350W | 450W | 575W |
每瓦性能(GFLOPS/W) | 233.03 | 406.63 | 734.22 | 728.71 |
有些人可能会认为能效提升可能受到更小晶体管尺寸的限制。但如果你看看使用M系列芯片的96W的14英寸MacBook Pro,它们的能效提升是稳定的。唯一的结论是,英伟达在从4090到5090的芯片设计上做得较差。
芯片 | M1 Max | M3 Max | M4 Max |
---|---|---|---|
半精度浮点运算(FP16 TFLOPS) | 21.2992 | 28.672 | 34.4064 |
每瓦性能(GFLOPS/W) | 221.87 | 298.67 | 358.4 |
讨论总结
本讨论源于帖子中提到的5090能效比略差于4090,评论者们从多个角度进行分析,包括芯片工艺、实际工作负载、硬件特性、能效计算合理性等方面,既有对原帖观点的支持,也有很多反对声音,整体讨论氛围比较理性、专业。
主要观点
- 👍 不同的芯片工艺会影响能效的提升
- 支持理由:如M芯片因使用不同工艺能效稳步提升,对比4090和5090处于相似节点能效提升受限。
- 反对声音:无。
- 🔥 比较性能不应仅看TDP,要看实际工作负载下的表现
- 正方观点:在LLM推理等实际场景下,GPU可降频降压不影响性能,仅看TDP不能反映真实情况。
- 反方观点:无直接反对观点,但有人强调原帖计算基于100%利用率有局限性。
- 💡 5090的512位宽总线和更多显存会消耗电量
- 解释:从硬件特性角度出发,认为这两个因素会增加电量消耗。
- 💡 桌面部件和移动部件因散热等因素在功耗方面存在差异,二者比较不太合理
- 解释:提到M3和M4 Max用于MacBook Pro受散热限制,与桌面部件的比较存在问题。
- 💡 认为限制5090功率到450W时其FP16高于450W的4090
- 解释:一种观点预测,后续引发关于该预测合理性以及与原帖观点关系的讨论。
金句与有趣评论
- “😂 panthereal: each m chip is using a smaller/different transistor process which is steadily gaining efficiency”
- 亮点:以M芯片为例解释芯片工艺对能效提升的影响。
- “🤔 黑暗之翼(darkwingfuck):It doesn’t make sense to compare TDP, we need to see how it actually performs under real workloads. Also for llm inference gpus can usually get away with some underclocking or undervolting without affecting performance”
- 亮点:强调不能仅看TDP判断性能,提出实际工作负载下的情况。
- “👀 似乎将桌面部件与移动部件进行比较是风马牛不相及的。”
- 亮点:简洁表达桌面部件与移动部件比较的不合理性。
- “😂 I can grantee if you power limit the 5090 to 450W it’s FP16 is going to be higher than the 4090 at 450w.”
- 亮点:提出一个有争议的关于5090功率限制后的性能预测。
- “🤔 96W? You mean… 96W charger? You calculated GFLOPS/W for a CHARGER?”
- 亮点:指出原帖对MacBook Pro 14的96W理解错误,质疑能效计算的合理性。
情感分析
总体情感倾向比较复杂,既有对原帖观点的认同,也有很多质疑和反对。主要分歧点在于原帖对5090和4090能效比较的方式是否合理,如能效计算、是否仅看TDP等方面。可能的原因是大家从不同的专业角度出发,对能效相关概念和影响因素的理解存在差异。
趋势与预测
- 新兴话题:关于下一代显卡的制程节点、能效改进以及显存容量的推测可能会引发后续讨论。
- 潜在影响:对显卡制造商在芯片设计、能效优化以及产品宣传等方面可能产生影响,也可能影响消费者在选择显卡时对能效因素的重视程度。
详细内容:
标题:关于 5090 能源效率的热门讨论
在 Reddit 上,一则有关“Energy efficiency of 5090 is slightly worse than 4090”的帖子引发了广泛关注。该帖指出,尽管前两代在能源效率上有显著提升,但英伟达这次表现不佳,5090 仅靠更高的 VRAM 大小和显著更高的内存带宽来支撑。此帖获得了众多点赞和大量评论。
帖子主要的讨论方向集中在对 5090 能源效率不如预期的原因分析,以及与其他芯片的对比。
核心问题在于:5090 能源效率降低是芯片设计问题,还是受到工艺节点等因素的限制?
讨论焦点与观点分析:
有人认为,每个 M 芯片使用的更小或不同的晶体管工艺在稳步提高效率。也有人指出 4090 和 5090 在相似的节点上,高功率下的能效增益递减是可以预期的。
还有人提出,如果卡在相同的节点,工程师应该在两年内挤出更多性能。但也有人认为工程师无法突破宇宙施加给他们的限制。
有人提到,在过去,英特尔交替更新架构和采用新的工艺节点。因此认为英伟达在无法到达下一个工艺节点时(可能出于成本削减目的),应该更新架构。但也有人指出这种模式已经因为各种原因被打破。
有人认为在某个节点上,特定指令的最佳实现已经存在,架构上无法再进一步改进。
有人质疑,如果英伟达无法更新架构,为何不升级现有架构以适应新的工艺,而苹果能够推出新的工艺产品。但也有人解释苹果能够这样做是因为其品牌有巨大的利润空间,可以投入更多成本。
有人认为英伟达根本不制造芯片,而是购买,这主要取决于他们愿意为此支付多少。
有人认为不能单纯比较 TDP,需要看实际工作负载下的表现。也有人分享了自己 14 英寸 Macbook Pro 在推理时的功耗情况。
有人指出 OP 仅基于 TDP 进行计算是有问题的,需要进行实际测试。有人认为 5090 的性能曲线可能并非线性,在相同的 FLOP 下,4090 可能更节能。但也有人认为 5090 有更高的功率效率,比如更低的提升时钟、更高的内存总线宽度、更节能的 GDDR7 等。
有人认为不能简单地将桌面部件与移动部件进行比较,因为它们在功率使用上有根本的限制。
有人认为,如果将 5090 的功率限制在 450W,其 FP16 可能会高于 4090 在 450W 时的表现。
有人认为 OP 的计算不全面,需要考虑更多因素,比如实际能耗、不同的设置和多种模型的测试等。
感谢您的耐心阅读!来选个表情,或者留个评论吧!