原贴链接

我在想,为什么英特尔、英伟达或者AMD没有想出能够扩展内存的办法呢?我知道DDR6价格昂贵,但如果他们中的一家制造出相关模块并出售,难道不能盈利吗?想象一下如果英特尔首先推出这个,我打赌我们大多数人会将显存用到最大,整个社区将远离英伟达并创建更好或者类似CUDA的框架。你们怎么想?

讨论总结

这个讨论围绕着GPU为何不能像PC内存那样可扩展(可拆卸)展开。众多评论者从不同角度进行分析,包括技术层面如信号完整性、速度、延迟、散热等因素,也有从商业利益、市场壁垒、成本等方面进行解释的,总体讨论氛围比较理性,大家各抒己见。

主要观点

  1. 👍 显存采用焊接方式有利于提高信号完整性、散热且成本更低
    • 支持理由:焊接能缩短线路,提高信号完整性从而提升性能,便于散热片覆盖利于散热,且直接焊接芯片到电路板比采用机械插槽成本低。
    • 反对声音:无
  2. 🔥 过去GPU存在有可扩展内存的情况,但早期可扩展内存速度难以满足大多数需求
    • 正方观点:早期部分GPU有可扩展内存,如Trident VG - 2000。
    • 反方观点:这种早期可扩展内存速度不够快,对多数应用来说实用性低。
  3. 💡 英伟达故意使GPU内存升级变难,因为显存是其一大卖点
    • 解释:存在理论上可升级显存的情况,但英伟达为了盈利,利用显存作为卖点,故意增加升级难度。
  4. 💡 GPU可被看作是可移除的内存,在LLM推理方面,3090这种GPU存在类似的情况
    • 解释:以3090在LLM推理中的情况为例,阐述GPU可视为可移除内存的观点。
  5. 💡 可移动内存可能存在工作、制造方面的问题,板载芯片在多方面更具优势
    • 解释:可移动内存像汽车通用零件可能出现工作异常、制造缺陷等问题,板载芯片在质量控制、速度、成本、制造过程等方面表现更好。

金句与有趣评论

  1. “😂 可移动ram就像为汽车购买通用零件 - 它可能会工作,但会引起一些问题、制造缺陷和一些重大的权衡。”
    • 亮点:用汽车通用零件类比可移动内存,生动形象地指出可移动内存可能存在的问题。
  2. “🤔 Signal integrity is better with the shorter traces which means you can push clocks higher and get better performance (bandwidth and latency).”
    • 亮点:简洁地阐述了信号完整性与线路长短对性能的影响。
  3. “👀 一切都可以标准化。制造商只是不想这么做。”
    • 亮点:指出GPU内存可扩展在技术上可被标准化,但制造商缺乏动力。
  4. “😎 I mean, you still can upgrade memory, I think there are custom 24gb RTX 2080ti’s out there, but Nvidia is actively making it harder because Vram is a big selling point.”
    • 亮点:揭示英伟达故意使GPU内存升级变难的商业意图。
  5. “🧐 在任何对时间敏感的电路中,如内存电路,增加设备间距离会增加信号到达目的地的时间。更多的时间 = 更慢的数据速率。”
    • 亮点:清晰地解释了电路中距离与信号传输时间、数据速率的关系。

情感分析

总体情感倾向比较理性客观,主要分歧点在于对GPU没有可扩展内存的原因认定上。部分人从技术角度如信号完整性、速度等认为GPU不适合可扩展内存,部分人从商业角度如英伟达为了盈利故意为之等方面进行解释。可能的原因是大家从不同的专业背景或思考角度出发,看待问题的侧重点不同。

趋势与预测

  • 新兴话题:探讨在GDDR或HBM模块添加芯片与可插拔内存模块设计的关联、没有无内存的离散GPU以及带GPU插槽主板来共享内存的设想。
  • 潜在影响:如果GPU可扩展内存实现,可能会影响显卡的销售模式、制造商的盈利策略以及相关的硬件生态系统。对数据中心、游戏玩家、人工智能等领域使用GPU的成本和性能提升方面可能产生较大影响。

详细内容:

《为何 GPU 不能拥有像 PC 内存那样的可拆卸式内存?Reddit 热门讨论引发深思》

在 Reddit 上,一则题为“为何 GPU 不能拥有像 PC 内存那样的可拆卸式内存?”的帖子引发了广泛关注。该帖子获得了众多点赞和大量评论,大家就这一话题展开了热烈讨论。

讨论焦点主要集中在以下几个方面: 有人指出,信号完整性是关键因素。较短的线路意味着可以提高时钟频率和获得更好的性能。比如,有用户分享道:“Signal integrity is better with the shorter traces which means you can push clocks higher and get better performance (bandwidth and latency). This is pretty crucial. They are also more resilient to thermal cycling (or so I’ve heard it argued). Cooling. It’s easier to get soldered memory chips under the heatsink and cooling is also crucial. Cost. It’s cheaper to make a board with chips soldered directly to it rather than implementing some form of mechanical slot system.”

同时,也有观点认为,内存总线的宽度和速度存在差异。比如,“PC memory bus is only 64 bits wide. A 3090 is 384 bits wide and a 5090 is 512 bits wide. It’s probably physically impossible to route 512 lines across the motherboard given space constraints AND having to arrive in time with a much tighter timing spec.”

关于 CPU 和 GPU 对内存的需求不同,有人表示:“The CPU uses memory caches and executing a program has a very predictable access pattern (linear/sequential). So, with a good cache algorithm and prefetching, the parts of the executing program that need to be in cache almost always are.”

还有人提到,缓存机制对 GPU 的作用有限,比如:“Caching takes a lot of the sting out of low memory speeds. Wouldn’t work so well for a GPU, where you often have to access very large amounts of memory in a very short time.”

在讨论中,存在一些共识。例如,大家普遍认同物理因素和成本因素对 GPU 内存设计的限制具有重要影响。

特别有见地的观点包括,有人提出随着时间推移,未来可能会出现类似的创新设计;也有人认为不同厂商的市场策略和竞争格局对此也有影响。

然而,对于这一问题,争论依然存在。一些人认为技术上完全有可能实现可拆卸式 GPU 内存,只是目前没有厂商愿意这样做;另一些人则坚持认为物理限制是不可逾越的障碍。

总之,Reddit 上的这场讨论充分展示了关于 GPU 内存设计的复杂性和多样性,让我们对这一技术问题有了更深入的思考。