原贴链接

无实际内容，仅有一个图片链接（https://llminfo.image.fangd123.cn/images/zqi0jvuc64ee1.png!/format/webp）和一个模型的HuggingFace链接（https://huggingface.co/deepseek - ai/DeepSeek - R1）

讨论总结

这个讨论主要围绕DeepSeek - R1展开，话题包括模型发布方式、不同版本之间的差异、参数规模以及在不同设备上的可用性等。大家对DeepSeek - R1展现出浓厚的兴趣，有很多疑问和期待。

主要观点

👍 DeepSeek发布模型时直接放出权重，不同于其他公司的多种操作
- 支持理由：评论指出其他公司发布模型有预发布炒作等多种操作，而DeepSeek直接将权重放在HF。
- 反对声音：无
🔥 对DeepSeek不同版本之间区别存在疑问
- 正方观点：很多人对V3、R1、R1 Zero、R1 lite等版本之间的区别不清楚，需要解答。
- 反方观点：无
💡 对DeepSeek - R1的大参数规模表示惊讶
- 支持理由：许多人没想到会有6850亿参数的模型存在。
- 反对声音：无
💪 认为GPT - 4的参数规模存在多种观点
- 支持理由：有认为超过1万亿，有认为是1.75万亿，也有认为是1.3万亿。
- 反对声音：无
🤔 R1基于DeepSeek V3而非V2.5
- 支持理由：根据DeepSeek的huggingface页面得出。
- 反对声音：无

金句与有趣评论

“😂 Other companies releasing models: pre - release hype posts, countdown timer, PR / marketing articles, benchmark evaluation, charts, alignment disclaimers, CO2 emission reports, arXiv pre - prints, model weights in the "near future". DeepSeek releasing models: dump da weights on HF.”
- 亮点：简洁对比了其他公司和DeepSeek发布模型时的不同之处。
“🤔 is it out on chat.deepseek.com? "
- 亮点：这是对DeepSeek - R1模型是否在特定网站可用的直接询问，代表了大家对模型可用性的关注。
“👀 And I thought deepseek v3 was big. Great imma need to use scientific notation for this one.”
- 亮点：体现出对DeepSeek - R1参数规模之大的惊叹。

情感分析

总体情感倾向是积极好奇的。主要分歧点在于GPT - 4的参数规模，可能的原因是缺乏官方准确消息，大家获取信息的来源不同。

趋势与预测

新兴话题：对DeepSeek - R1不同量化数值的探讨可能会引发后续讨论。
潜在影响：如果DeepSeek - R1能够在更多设备上运行，可能会推动相关领域的发展，如自然语言处理等。

详细内容：

标题：关于 DeppSeek-R1 模型的热门讨论

近日，Reddit 上一篇关于“DeppSeek-R1 685 亿参数”的帖子引发了广泛关注。该帖子获得了众多点赞和大量评论。原帖中包含了模型的相关链接https://huggingface.co/deepseek-ai/DeepSeek-R1 ，引发了大家对该模型的各种讨论。

讨论的焦点主要集中在模型的特点、与其他模型的对比以及运行条件等方面。有人表示，其他公司发布模型时会有各种预热宣传，而 DeepSeek 直接在 HF 上公布了模型权重。还有用户分享道：“Reminds me of OG Mistral. Love it.” 有人提到，过去他们常常只提供磁力链接。

对于模型的差异，有人指出，v3 是非推理模型，R1 是推理模型，R1-lite 是能力稍弱的推理模型。关于模型的来源，有人认为 DeepSeek 的 huggingface 页面显示其基于 deepseek v3。

在关于模型规模的讨论中，有人感叹没想到有这么大参数规模的 AI 模型存在。有人提到 GPT-4 可能超过 1 万亿参数，也有人对此表示质疑，并给出了相关的研究论文链接https://arxiv.org/pdf/2412.19260 进行论证。

还有用户分享了自己对模型进行量化的个人经历：“I quantized R1 and R1 Zero to 2bit! It’s 200GB, but they work OK! https://huggingface.co/unsloth/DeepSeek-R1-Zero-GGUF and https://huggingface.co/unsloth/DeepSeek-R1-GGUF ”

很多用户关心模型的运行条件，比如能否在自己的设备上运行，像“Can I run it on my 8gb macbook?”这样的问题频繁出现。

总之，这次关于 DeppSeek-R1 模型的讨论展现了大家对 AI 模型的浓厚兴趣和深入思考，同时也反映了在模型发展过程中用户们的期待和困惑。

讨论总结#

主要观点#

金句与有趣评论#

情感分析#

趋势与预测#

详细内容：#