原贴链接

所以,AMD今天发布了9070和9070 XT,其内存带宽为624GB/s,显存为16GB DDR6 VRAM(256位)。仍然有传言称即将推出具有32GB DDR6内存的显卡。这些显卡将额外花费250 - 300欧元或美元,所以显卡价格将略低于1000欧元。

假设这些显卡确实推向市场,并且基于功耗为220W的9070。这对我们有什么好处呢?

我们可以为每个双槽GPU增加32GB的VRAM。该VRAM将比新的AMD Ryzen AI Max + 395电脑(如Framework Desktop,其四通道LPDDR5X - 8000可达到256GB/s)快2.43倍。该内存将比具有384位DDR6X、24GB显存的RTX 3090的936GB/s慢。每GB VRAM的价格将与二手RTX 3090 24GB(假设价格为720欧元)相似。

一个具有128GB VRAM的系统成本,4个GPU大约为4000欧元,提供足够PCIe 5.0通道的EPYC系统大约为3000欧元(例如,约940欧元的EPYC 9115 16核CPU和约1260欧元的具有7个PCIe插槽的ASRock Rack GENOAD8X - 2T/BCM主板)。

我们最终得到的系统在推理时可能快2.4倍,但也比Framework Desktop系统贵3倍,功耗也高得多(可能约为1100瓦)。如果有额外预算,我们可以在主板上插入更多(使用PCIe扩展器)超过4个GPU以增加更多VRAM,这是当前一代AMD AI系统无法做到的。使用6个GPU我们就有192GB的VRAM。相当诱人。到目前为止,要在一张卡上获得超过24GB的VRAM意味着每张卡要花费数千美元或者得到相当过时的产品。

讨论总结

该讨论主要围绕AMD发布的9070及相关显卡展开。原帖对9070系列显卡的性能、价格等进行了分析,评论中涉及多个方面,包括AMD是否会推出32GB DDR6内存显卡、不同显卡的显存适用性(如游戏场景下对显存的需求)、ROCM在Linux系统中的设置问题、不同配置(如GPU和CPU构建)的性价比以及新显卡对二手市场的影响等。整体讨论充满技术分析,氛围较为理性。

主要观点

  1. 👍 MI60有32GB VRAM和1024 GB/s的内存吞吐量,最高功耗达300W,不受现代ROCm支持,但llama.cpp的Vulkan支持在一定程度上弥补了这一问题,期待llama.cpp新的训练功能推出
    • 支持理由:评论者自身拥有MI60的使用体验
    • 反对声音:无
  2. 🔥 AMD可能没有明确否认32GB DDR6内存显卡的计划,可能会有W9070工作站显卡推出且价格可能在1000 - 1200美元,但这一价格预估的合理性受到质疑,因为以往类似容量显卡价格更高,价格预估可能与产品定位有关,AMD有降低工作站显卡价格的趋势
    • 正方观点:AMD的官方表态未完全否定计划,从产品定位和价格趋势推测
    • 反方观点:以往产品价格情况与之矛盾
  3. 💡 在Linux上设置ROCM需要特定内核版本,不同Linux发行版在ROCM的使用体验上存在差异
    • 解释:不同用户在不同Linux发行版(如Arch、Ubuntu、Debian等)上的使用反馈
  4. 💡 游戏对显存需求存在比例关系,多数游戏不需要超过16GB显存,以游戏玩家为受众考虑,24GB显存已具备未来适用性,对推出超过24GB显存的显卡的必要性表示怀疑
    • 解释:根据游戏适配显存比例得出结论
  5. 💡 32GB版本因主板PCIe插槽情况有存在意义,不同配置在成本和性能上各有特点,新的GPU产品是一种替代而非改进,其可能影响二手市场,目前CPU构建更具性价比
    • 解释:从主板插槽、成本性能对比、市场影响等方面分析

金句与有趣评论

  1. “😂 This is making me feel better about having picked up my MI60, with 32GB of VRAM and memory throughput of 1024 GB/s.”
    • 亮点:表达了对自己拥有MI60显卡的满足感
  2. “🤔 They only said it will not have the name 9070 XT. But neither confirmed nor denied any plans for workstation 9070s.”
    • 亮点:指出AMD对工作站9070显卡计划的态度模糊
  3. “👀 ROCM is still kind of a pain in the ass to setup. On Linux, you have a to use a specific kernel version to make it work.”
    • 亮点:强调了在Linux上设置ROCM的困难之处
  4. “😉 90% of games are fit into 8GB of VRAM in ultra/4k, 98% fit into 12GB, and like 99.9% into 16GB”
    • 亮点:用数据直观展示游戏对显存的需求比例
  5. “💡 they are not an improvement but rather an alternative and maybe will flood the used - market with cheap but valuable material…I’m exited for them!!
    • 亮点:提出新GPU产品对二手市场可能产生的影响并表达期待

情感分析

总体情感倾向较为理性中立。主要分歧点在于对AMD可能推出的32GB DDR6内存显卡价格预估的合理性、在Linux上ROCM设置的难易程度感受不同等。可能的原因是不同用户的使用经验、对市场和产品的预期以及个人偏好不同。

趋势与预测

  • 新兴话题:AMD是否会增加32GB显存显卡的总线宽度以及RDNA 4的芯片设计多样性。
  • 潜在影响:如果AMD推出新的显卡产品,可能会对显卡二手市场价格产生波动,同时也可能影响游戏开发对显存需求的考量以及Linux用户在选择发行版时对ROCM支持的重视程度。

详细内容:

标题:AMD 新款显卡 9070 系列引发的热门讨论

近日,AMD 发布了 9070 和 9070 XT 显卡,其拥有 624 GB/s 内存带宽和 16GB DDR6 VRAM(256 位)。同时,关于即将推出配备 32GB DDR6 内存的显卡的传闻不断。此贴获得了众多关注,引发了大量讨论。

有人认为,若这些 32GB 显卡上市,基于 9070 且功耗 220W 的情况下,每 2 插槽 GPU 可增加 32GB VRAM,其 VRAM 速度比新 AMD Ryzen AI Max+ 395 PC(如 Framework Desktop,其管理 256GB/s 并配备四通道 LPDDR5X-8000)快 2.43 倍,但比 RTX 3090 24GB(384 位 DDR6X,936 GB/s)的内存慢。每 GB VRAM 的价格与二手 RTX 3090 24GB 相似(假设价格为 720 欧元)。构建一个拥有 128GB VRAM 的系统,4 个 GPU 约 4000 欧元,加上提供足够 PCIe 5.0 通道的 EPYC 系统约 3000 欧元。这样的系统在推理期间可能快 2.4 倍,但也比 Framework Desktop 系统贵 3 倍,功耗更高(约 1100 瓦特)。

讨论焦点与观点分析:

  • 有人分享自己选择了 MI60,拥有 32GB VRAM 和 1024 GB/s 的内存吞吐量。但存在功耗较高和不被现代 ROCm 支持的问题,不过 llama.cpp 的 Vulkan 支持有所缓解。
  • 有用户拥有 2 个 MI60 和一些 MI50 32GB 显卡,并分享了在 vLLM 中的性能表现。
  • 有人指出 MI60 和 MI50 32GB 虽有吸引力,但在计算和效率方面因年代久远而存在不足。
  • 有人认为若 AMD 推出 1000 - 1200 美元的 32GB “9070 XTX”,将改变局面,会让更多项目对 ROCm 支持感兴趣。
  • 关于 ROCm 对某些显卡的支持存在争议,有人认为 AMD 已停止对某些显卡的支持,也有人表示仍在支持。
  • 有人提到 ROCM 安装设置存在困难,不同操作系统和版本的情况不同。
  • 有人质疑增加显卡 VRAM 的必要性,认为对游戏玩家而言 24GB 已足够,或许是为了 LLM 社区。

总之,关于 AMD 新款显卡的讨论十分热烈,各方观点各异,充满了对其性能、价格、市场定位等方面的关注和思考。