原贴链接

注意,除了我所说的之外,我没有任何证据。最近我遇到了一位华为员工,他正在为他们的910B芯片推广人工智能业务。我们最终没有选择他们,但在这个过程中我了解到了一些有趣的信息:1. 华为910C与910B架构相同;2. 910C的fp16浮点运算目标为800 TFLOPS(不清楚是否是fp32累加或者fp16),提到他们的目标是接近英伟达H200 NVL;3. 910C采用中国7nm工艺;4. 910C打算使用中国的HBM2e,他们没有提供关于容量或带宽的评论;5. 910C旨在解决910B中存在的严重的跨卡互连问题,该问题导致910B不适合用于训练大型语言模型;6. 他们提到华为升腾芯片的首席设计师(第一个升腾设计)是一位在美国接受教育的中国学生。没有提供他在美国是本科还是博士学历的细节,但提到他最初的设计重点是边缘/低功耗推理。他们提到他们的电子设计自动化(EDA)和编译器团队很大一部分人有美国本科/博士学历;7. 他们的目标是让910C的性能精确地是910B的两倍。他们暗示这是通过小芯片(chiplets)实现的,但当我追问细节并试图确认时,他们含糊其辞;8. 他们的目标是在2025年第一或第二季度公开样品;9. 他们声称比AMD有更好的PyTorch兼容性,并且说与英特尔当前的GPU兼容性相当;10. 他们声称自2024年第一季度910B推出以来,PyTorch兼容性有了显著提高。并且提到在fp16下,他们在PyTorch操作符兼容性/准确性方面投入了大量精力,还有他们自己的神经网络处理器应用程序接口(NPU API)叫做ACL;11. 他们抱怨910B优先提供给一些没有可行云业务的“云”基础设施客户,并且需要大量的现场生态系统支持。他们喜欢与有扩展基础设施技能的人工智能创业公司合作;12. 他们提到总体上供不应求;13. 他们抱怨某些客户仍然宁愿使用走私的英伟达芯片而不是他们的解决方案;14. 他们抱怨必须与英伟达保持错误兼容性,并努力解决准确性问题;15. 他们正在为910C的后续产品寻求一种新的架构。

讨论总结

原帖发布了关于华为910C芯片性能翻倍等多方面的消息,但无确切证据。评论主要聚焦于华为910C芯片的各项性能指标及相关影响因素,如有人认为性能翻倍可能导致TDP不止翻倍,也有人从LLM的角度探讨了内存相关问题,还有人关注其定价。同时也涉及华为受打压与开源人工智能发展关系等宏观话题,整体讨论较为理性客观。

主要观点

  1. 👍 华为910C采用7nm制程,性能翻倍可能会使TDP不止翻倍
    • 支持理由:因为采用7nm制程,按照常理性能翻倍可能会使TDP不止翻倍。
    • 反对声音:有人认为原帖暗示了TDP大致翻倍。
  2. 🔥 在中国构建数据中心的情况下,只要芯片性能好,TDP不是首要考虑的问题
    • 正方观点:中国构建数据中心更看重芯片性能,TDP可解决。
    • 反方观点:无明显反方观点。
  3. 💡 在LLM背景下,RAM是重要因素,同时价格也值得关注
    • 解释:在LLM场景下,RAM的重要性不可忽视,其价格也影响使用。
  4. 💡 华为有芯片是好事,竞争是受欢迎的
    • 解释:评论者从不知晓华为有芯片到认可,认为竞争有积极意义。
  5. 💡 思考华为未被打压时开源人工智能的场景,竞争能促使企业推出更好的模型
    • 解释:从宏观角度探讨华为受打压与开源人工智能发展的关系,强调竞争的积极作用。

金句与有趣评论

  1. “😂 Ok_Warning2146:Should have asked them about the TDP. Since they are stuck at the 7nm node, doubling performance will more than double the TDP.”
    • 亮点:率先提出在7nm制程下性能翻倍与TDP关系的疑问。
  2. “🤔 Recoil42:OP does say: >They are aiming for an exact silicon doubling of the 910B. They suggested this was done via chiplets, but were evasive when I pushed for details and tried to confirm this >That does suggest a rough doubling of TDP.”
    • 亮点:根据原帖内容对TDP是否翻倍进行分析。
  3. “👀 AnomalyNexus:TDP doesn’t matter that much imo. Cooling is a solvable problem if your name is china and you want to building out datacenters with domestic tech. As long as the chips performing whether they run hot or use lots of energy is secondary.”
    • 亮点:从中国构建数据中心的角度阐述TDP不是关键因素。
  4. “😂 在LLM RAM是最重要问题(当然,还有价格,哈哈),很想听到关于这些的情况。”
    • 亮点:在LLM背景下强调RAM和价格的重要性。
  5. “🤔 真的很好,竞争总是受欢迎的。”
    • 亮点:简洁表达对华为有芯片带来竞争的积极态度。

情感分析

总体情感倾向为中性。主要分歧点在于华为910C性能翻倍时TDP的情况以及在不同场景下各因素(如TDP、RAM等)的重要性。可能的原因是不同用户从不同的技术背景和应用场景出发考虑问题,有的关注芯片性能提升带来的功耗变化,有的则更看重在特定场景(如构建数据中心、LLM运行)下芯片各方面因素的综合权衡。

趋势与预测

  • 新兴话题:华为910C芯片的定价还未被深入讨论,可能会引发后续关注。
  • 潜在影响:如果华为910C性能如预期提升,可能会对人工智能领域的竞争格局产生影响,尤其是在国内数据中心建设和LLM发展方面。

详细内容:

《传闻:华为 910C 芯片性能或翻倍 910B》

近日,Reddit 上一则有关华为芯片的帖子引发了广泛关注。该帖子称,在与华为员工的交流中获知了一些关于华为 910C 芯片的信息,但无法提供相关证明。此贴获得了众多点赞和大量评论。

帖子主要内容包括:华为 910C 与 910B 架构相同;910C 目标达到 800 TFLOPS 的 fp16 性能;采用中国 7nm 工艺;计划使用中国 HBM2e;旨在解决 910B 存在的跨卡互联问题;提到首席设计师是在美国接受教育的中国学生等。同时,还提到 910C 计划通过芯粒实现性能翻倍,目标于 2025 年第一或第二季度公开采样,声称在 PyTorch 兼容性方面优于 AMD 等。

讨论焦点主要集中在芯片的性能、功耗、价格、内存等方面。有人指出,既然仍采用 7nm 节点,性能翻倍可能会使 TDP 大幅增加,不过也有人认为对于中国建设数据中心来说,散热不是大问题。还有人好奇芯片的定价和内存配置。有人对华为能推出芯片表示称赞,认为竞争是好事;也有人提出疑问,如若是用于视频处理只有 2Gb 内存的新 AI 芯片则意义不大。

总体来看,大家对于华为 910C 芯片充满期待,同时也在持续关注其性能、价格等关键指标,希望能为行业带来更多惊喜。但关于芯片的具体表现,还需等待更多确切消息。