原贴链接

英伟达在本月初发布了一个开源的大型语言模型（LLM），据说可以与Llama 405B、GPT4o和Claud 3.5竞争。这似乎是一件大事，但我几乎没有看到相关新闻，也没有看到YouTube的AI频道对它进行测试。有人测试过它吗？它在创意写作、编码和审查方面表现如何？我很高兴这样一家重要的公司支持开源。https://venturebeat.com/ai/nvidia-just-dropped-a-bombshell-its-new-ai-model-is-open-massive-and-ready-to-rival-gpt-4/ https://huggingface.co/nvidia/NVLM-D-72B

讨论总结

本次讨论围绕Nvidia新开源的LLM NVLM - D - 72B展开。大部分评论者对这个模型不看好，有的认为它被过度炒作，甚至指出它是其他模型的微调版本，还有人觉得Nvidia应该专注于GPU制造而不是涉足AI模型领域，并且从大众关注度来看，多数人并不关心这个模型，甚至有使用者称相关的AI体验很差。

主要观点

👍 NVLM - D - 72B被过度炒作。
- 支持理由：它并非像宣传的那样是重大事件，已有更好的开源权重模型。
- 反对声音：无
🔥 Nvidia应专注于GPU制造的改进。
- 正方观点：Nvidia在GPU领域有很大优势，应专注于此改进。
- 反方观点：Nvidia涉足AI模型领域也有一定意义。
💡 Qwen2.5 72B是目前最好的开源权重LLM之一。
- 理由：根据多个基准测试得出。
🤔 多数人不关心英伟达模型。
- 解释：模型发布消息热度消退快，缺乏足够吸引力。
😒 用过Nvidia的Chat with RTX离线AI体验很差。
- 解释：基于自身使用体验。

金句与有趣评论

“😂 It isn’t actually a massive deal. It was just hyped up.”
- 亮点：直接指出NVLM - D - 72B被炒作，简洁表达了对模型发布的看法。
“🤔 Nvidia should stick to making GPUs and figure out a way to make them cheaper, faster and more VRAM.”
- 亮点：提出Nvidia应专注于GPU制造的观点，引发后续讨论。
“👀 Qwen2.5 72B is currently, in my opinion and according to multiple benchmarks (e.g. LiveBench), the best open - weights LLM.”
- 亮点：给出了Qwen2.5 72B是最好开源权重LLM的依据。
“😒 我使用过他们的Chat with RTX离线AI，可能是用过的最糟糕的AI。”
- 亮点：以自身使用体验说明对Nvidia产品的不满。
“💡 A non - commercial model today, if it introduces anything interesting or new, will have an equivalent open license version in the future. It’s only a matter of time.”
- 亮点：从商业许可角度看待模型的发展。

情感分析

总体情感倾向为负面。主要分歧点在于Nvidia涉足AI模型领域是否有意义，部分人认为Nvidia应专注于GPU制造，而另一些人觉得涉足AI模型领域也有一定价值。可能的原因是大家对Nvidia的传统优势（GPU制造）和新兴领域（AI模型）的期望和认知不同。

趋势与预测

新兴话题：模型的商业许可对其发展的影响可能会成为后续讨论话题。
潜在影响：如果大众持续对Nvidia的AI模型不看好，可能会影响Nvidia在AI模型领域的投入和发展策略，也可能促使其更加注重GPU制造的优化。

详细内容：

标题：Nvidia 开源 LLM NVLM-D-72B 引发的热议

Nvidia 在月初发布了一款开源的语言模型 NVLM-D-72B，据称其能与 Llama 405B、Gpt4o 和 claud 3.5 相媲美。此帖获得了较高的关注度，引发了众多讨论，但相关新闻报道较少，也未在 YT AI 频道看到测试。有人提问是否有人测试过，它在创意写作、编码和审查方面表现如何。帖子还提供了相关链接：https://venturebeat.com/ai/nvidia-just-dropped-a-bombshell-its-new-ai-model-is-open-massive-and-ready-to-rival-gpt-4/ 、https://huggingface.co/nvidia/NVLM-D-72B 。文章将探讨 NVLM-D-72B 在各方面的表现以及其开源的意义和影响。

在讨论中，观点纷呈。有人认为这并非什么大事件，只是被炒作了，NVLM-D-72B 只是 Qwen 2.0 72B 的微调版本。也有人表示从 Mistral - Large - 2 获得的编码答案比 Qwen 2.5 72B 更好，而 DeepSeek v2.5 在编码方面表现更佳但运行困难。还有人指出当说语言模型“擅长编码”时，这可能因编程语言而异。

有用户提到一般来说，先进的语言模型在大多数编程语言中的表现相似，但在某些特定语言上可能会因数据量和流行程度而有细微差别。对于非常小众的编程语言和语言，语言模型的表现可能会明显较差。

关于 Nvidia 涉足这一领域，观点不一。有人觉得 Nvidia 应专注于制造更便宜、更快且 VRAM 更多的 GPU，其所有模型都很糟糕。但也有人认为 Nvidia 在硬件/软件协同设计方面有优势，涉足相关工作负载有助于推动系统进化，这是一个从模型到硬件的全面机会，能销售更多硬件和 AI 企业许可证，是明智之举。也有用户认为 Nvidia 已经在降低成本、提高速度和增加 VRAM 方面做得比其他公司好很多。

还有人认为大多数人其实并不关心 Nvidia 模型，相关的发布很快就会销声匿迹。有人用过 Nvidia 的 Chat with RTX 离线 AI，认为是用过的最差的 AI 之一，所以对新的发布不感兴趣。也有人指出非商业许可模型如果有新颖之处，未来可能会有开放许可版本，关键在于技术是否有趣。

总的来说，对于 Nvidia 开源的 NVLM-D-72B 模型，大家的看法褒贬不一，在其性能、Nvidia 的业务方向以及许可模式等方面存在诸多争议和讨论。

讨论总结#

主要观点#

金句与有趣评论#

情感分析#

趋势与预测#

详细内容：#