原贴链接

讨论总结

该Reddit讨论围绕标题中Google是否理解DeepSeek R1在FP8中训练展开。评论内容涵盖多个方面，包括对AI行业存在图表造假现象的批判，DeepSeek R1运行的硬件需求，模型训练精度相关的技术讨论，对DeepSeek R2的期待，以及对公司用误导性图表进行产品宣传的厌恶等，整体氛围理性且多元。

主要观点

👍 AI行业存在图表造假现象
- 支持理由：多个评论者指出AI行业存在此类问题，如h666777认为AI行业是一系列数据图表造假情况。
- 反对声音：无
🔥 DeepSeek R1可在多种硬件条件下运行
- 正方观点：如在8xH200s（约16个H100s）、2个3090和足够DDR4内存上能运行等不同硬件环境下运行，有NVIDIA博客展示相关内容。
- 反方观点：无
💡 训练在FP8可能意味着以BF16进行服务
- 支持理由：55501xx指出图表是推理相关，训练在FP8可以意味着以BF16服务，并给出GitHub链接。
- 反对声音：无
🤔 模型被识别的格式比训练时被指定的格式更重要
- 正方观点：有评论者认为模型被识别为何种格式才是关键。
- 反方观点：有从医学角度认为两者都重要的观点，也有列举多方面证据证明模型发布是FP8格式的观点。
😎 对于单个用户使用DeepSeek，如果需要更多GPU加载模型则效率很低
- 支持理由：Anthonyg5005指出在云环境下可扩展性不是问题时DeepSeek才在电力消耗方面高效，对于单个用户若需更多GPU加载则效率低。
- 反对声音：无

金句与有趣评论

“😂 h666777：I swear to god man, at this point the AI industry is just a series of chart crime after chart crime.”
- 亮点：直接而大胆地指出AI行业图表造假严重的现象。
“🤔 55501xx：This chart is referring to inference. Trained in FP8 can mean served at BF16.”
- 亮点：对DeepSeek R1在FP8训练与BF16服务之间关系提出见解并开启相关技术讨论。
“👀 Anthonyg5005：To be fair, deepseek is still more inefficient than it needs to be in terms of memory footprint because it’s still an moe”
- 亮点：指出DeepSeek在内存占用方面因模型类型而效率较低。
“😏 ROOFisonFIRE_usa：Jeez its freaking insane how much misinformation there is out there.”
- 亮点：强调关于DeepSeek R1存在很多错误信息。
“🙄 Hour_Ad5398: that bar chart is fucking retarded”
- 亮点：用比较粗俗的表达直白地对图表表示不满。

情感分析

总体情感倾向较为复杂，既有对AI行业图表造假、公司误导性图表宣传的负面情感，也有对DeepSeek R2期待等正面情感。主要分歧点在于模型相关技术问题，如模型格式重要性、DeepSeek的效率等方面。可能的原因是评论者的不同专业背景和对相关技术的理解程度不同。

趋势与预测

新兴话题：DeepSeek R2的性能及与R1的差异可能会引发后续讨论。
潜在影响：对AI模型的开发、评估以及行业内数据展示的规范可能会产生影响，促使行业更加重视数据真实性和技术准确性。

详细内容：

标题：关于 Google DeepSeek R1 训练格式的热门讨论

在 Reddit 上，一则关于“Does Google not understand that DeepSeek R1 was trained in FP8?”的帖子引发了广泛关注。该帖子获得了众多点赞和大量评论。帖子主要围绕 DeepSeek R1 的训练格式展开，引发了关于其精度、存储需求、计算效率等多方面的讨论。

讨论焦点与观点分析如下：有人认为当前的 AI 行业存在一系列问题。也有人觉得图表可能是由 AI 生成的。还有用户表示，昨天向 Gemini 询问图表准确性时，它对图表中的点数感到沮丧，认为这是人为的图表错误。对于 DeepSeek R1 的训练格式，有人指出并非所有权重都以 FP8 训练，部分可能是 16 位甚至 32 位。在低精度浮点运算中，可能存在精度误差。但也有人认为在推理阶段不必局限于低精度，因为更高精度能带来更准确的结果。有用户提到，将 FP8 权重转换为 BF16 可能是为了减少浮点误差。然而，也有人质疑这种转换对于 Hopper GPU 的意义。有用户分享自己能够在特定硬件配置下运行 DeepSeek R1，展示了不同的个人经历和案例。有人认为模型通常以较高精度存储权重，在计算时采用低精度，以平衡精度和计算效率。对于图表的意义和准确性，存在多种观点。有人认为这类企业图表对投资者有意义，但数据意义不大。也有人指出图表中关于训练的表述不清晰，甚至存在误导。

在这场热烈的讨论中，大家各抒己见，观点交锋，充分展示了对这一技术问题的深入思考和不同见解。但对于 DeepSeek R1 训练格式的最优方案，仍未达成明确的共识。

讨论总结#

主要观点#

金句与有趣评论#

情感分析#

趋势与预测#

详细内容：#