在我迫切寻求更多PCIe通道时,我买了这个东西:技嘉G292 - Z20 2x PCIe G4 x16全高全长转接卡CRSG422。它基本上是一个PCIe 4.0x16的交换机,例如1个PCIe 4.0x16输入和2个PCIe 4.0x16输出,是一个真正的PCIe交换机,不需要任何分叉之类的操作,它包含一个Microchip PM40052芯片组,60美元超划算!它通过转接电缆连接到我的台式电脑上完全可以工作。但这不是重点……重点是将这一切连接到雷电控制器上!例如构建一个19英寸的机架,里面放一堆GPU(PCIe交换机连接到PCIe交换机?),所有设备都通过一根雷电电缆连接到主机PC!这样在不使用GPU设备时也可以关闭以节省闲置功耗。为了测试,我将它连接到一个带有M.2到PCIe适配器的雷电NVME硬盘盒上,然后,我的笔记本上就有了2个MI60!现在的设置完全是临时拼凑的。之后都会放在一个漂亮的19英寸机架里。也许会用新的雷电5或者至少用支持PCIe 4.0上行的高级Asmedia雷电控制器(我现有的NVME硬盘盒将向转接卡提供3.0x4)。这些卡通过x16连接在一起,我认为它们之间也可以以x16通信!我注意到在mlc - llm中使用2个MI60进行张量并行时没有性能损失,在70b Q4上约为15.2T/s。
讨论总结
原帖展示了一种利用PCIe 4.0x16开关将2个MI60连接到笔记本电脑实现64GB VRAM的设置。评论者们对这种设置展开了多方面的讨论,包括设备在不同场景下的性能、PCIe插槽相关疑问、GPU之间的通信,整体氛围积极,大家积极分享自己的想法、经验或者提出问题。
主要观点
- 👍 这种设置虽然简陋但很酷
- 支持理由:基本上能免费得到两个全速插槽,对PCIe通道有限的桌面设置有益
- 反对声音:无
- 🔥 设备在主板上的性能提升取决于使用场景
- 正方观点:对于大型语言模型推理,PCIe带宽影响不大;对于训练模型可能有用
- 反方观点:无
- 💡 有将PCIe 4.0 x16插槽分成两个3.0 x16的想法
- 解释:基于PCIe规格的点对点速度协商,对特定显卡和系统组合有用
- 💡 考虑通过特定PCIe连接方式实现显存堆叠
- 解释:涉及从x16到多个接口的转换,可用于特定型号显卡
- 💡 对帖子中的计算方式表示认同
- 解释:评论者本身正在寻找大显存的GPU,对这种高性能计算硬件配置感兴趣
金句与有趣评论
- “😂这非常不正规、简陋,但也真的很酷!”
- 亮点:简洁地概括了这种设置的特点,既看到不足又觉得很酷
- “🤔你基本上能免费得到两个全速插槽?这让PCIe通道有限的桌面设置更可行。”
- 亮点:点出这种设置对桌面设置的好处
- “👀PaulDotSH:Sorry for asking, I’m a newbie to all this stuff, but could something like this be used on a motherboard that is x16 x4 to get the performance of x16 x16 from both slots?”
- 亮点:体现新手对设备在特定主板上性能的疑问
- “😎我关注那些Gigabyte适配器在我的eBay关注列表里好几个月了,我都不知道有多少个月了。”
- 亮点:表明对Gigabyte适配器的长期关注
- “💡i was thinking about pcie x16 -> 4x m.2 -> m.2 -> oculink breakout (4x total) -> pcie 1x”
- 亮点:分享独特的关于硬件连接的思考
情感分析
总体情感倾向是积极的。主要分歧点较少,大部分评论者都在积极探讨原帖中的设置或者分享自己相关的经验和想法。可能的原因是这个话题比较小众且专业,吸引到的都是对这类硬件设备感兴趣的人,大家更多是抱着交流和学习的态度参与讨论。
趋势与预测
- 新兴话题:不同硬件连接方式实现特殊功能(如显存堆叠)可能会引发后续讨论。
- 潜在影响:如果这些硬件连接方式和设置被更多人了解和应用,可能会对计算机硬件爱好者进行个性化硬件配置产生一定的影响,推动更多人尝试创新的硬件组合方式。
详细内容:
标题:在笔记本电脑上实现 2 个 MI60 的 64GB VRAM?神奇的雷电 4 多 eGPU 探索!
最近,Reddit 上有一篇关于在笔记本电脑上实现强大图形处理能力的讨论引起了广泛关注。原帖作者分享了自己为获取更多 PCIe lanes 而购买的设备:Gigabyte G292-Z20 2x PCIe G4 x16 Full-High Full-Length Riser Card CRSG422 ,并详细介绍了其功能和使用情况。此帖获得了众多关注,评论数众多,引发了热烈的讨论。
讨论的焦点主要集中在这种设置的可行性、性能表现以及适用场景等方面。有人认为这是一种“神奇但也很酷”的方案,能让桌面设置在有限的 lanes 下更具可行性。比如,有用户提出,如果连接到 x8 或更低的插槽,它是否仍然能工作。还有人分享自己将其连接到 X4 插槽以及雷电控制器为 x4 的情况。
有用户询问这种方案能否用于 x16 x4 的主板以获得 x16 x16 的性能,有人回应称这取决于具体的使用场景,对于 LLM 推理,PCIe 带宽并不是很重要,甚至通过网络在不同计算机之间进行 RPC 来组合 GPU 都足够快,但对于训练,可能需要进一步探讨。
也有用户分享自己在 eBay 上关注类似适配器很久,还有人提到了在不同配置和速度下的使用情况及相关注意事项,如主板对 PCIe 分叉的支持以及 REBAR 等。
总之,这次讨论展现了大家对于创新的硬件配置方案的热情和探索,同时也揭示了在实际应用中可能面临的挑战和需要考虑的因素。但这种勇于尝试和探索的精神,无疑为电脑硬件爱好者们带来了更多的可能性和思考。
感谢您的耐心阅读!来选个表情,或者留个评论吧!