原贴链接

讨论总结

本讨论围绕DeepSeek部署与开源版本是否运行相同模型展开。一方面有人对模型一致性表示怀疑，如质疑是否使用特殊模块、是否存在未发布模型等；另一方面也有人认可二者相同。此外，还涉及硬件需求相关讨论，如运行所需硬件的配置、成本等。同时也有一些其他话题的讨论，像是角色扮演缺少系统提示时的解决办法、寻求支持图像上传的托管服务等，整体氛围多样，既有争议也有分享经验等平和的交流。

主要观点

👍 DeepSeek官方部署与开源版本运行相同模型
- 支持理由：未提及具体支持理由，但有人直接表示认可。
- 反对声音：很多人从不同角度质疑，如特殊模块是否开源、早期本地模型与API结果不同等。
🔥 多数人无法在家运行Deepseek - R1
- 正方观点：从统计学角度，硬件成本高等因素导致难以在家运行。
- 反方观点：少数有钱人有能力运行，且有一定硬件条件也可运行特定量化版本。
💡 MTP权重包含在开源模型中
- 解释：有用户引用Github自述文件等进行解释说明。
🤔 对未被美国不良商业文化洗脑表示欣慰
- 解释：基于深析模型的开源情况表达此观点。
😎 Perplexity pro能理解图像且在美国有托管服务
- 解释：针对有人寻求支持图像上传的托管服务给出此信息。

金句与有趣评论

“😂 Fucking legends.”
- 亮点：非常简短但强烈地表达了对DeepSeek部署与开源版本运行相同模型这件事的高度赞赏。
“🤔 Aren’t they using special multiple token prediction modules which they didn’t release in open source? So it’s not exactly the same as what they’re running themselves.”
- 亮点：提出关于DeepSeek官方部署与开源版本模型一致性的质疑，开启相关讨论。
“👀 If you don’t mind a low token rate (1 - 1.5 t/s): 96GB of RAM, and a fast nvme, no GPU needed.”
- 亮点：给出运行相关模型在不介意低令牌率情况下的硬件需求情况。
“😏 Yeah and for most of us that can’t run it locally, even API access is relatively cheap.”
- 亮点：针对不能本地运行模型的人提供了API访问相对便宜这一信息。
“🙄 You guys know, statistically speaking, none of you can run Deepseek - R1 at home… right?”
- 亮点：提出多数人无法在家运行Deepseek - R1这一观点引发讨论。

情感分析

总体情感倾向较为复杂。存在较多的怀疑情绪，主要分歧点在于DeepSeek官方部署与开源版本是否运行相同模型，部分人认为相同，部分人从模型可能存在的特殊模块、早期结果差异等方面质疑。可能的原因是大家对DeepSeek模型的了解程度不同，以及从不同角度（如技术、商业等）看待模型的部署和开源情况。

趋势与预测

新兴话题：Cerebral的r1部署及其极快的推理速度可能会引发后续讨论。
潜在影响：如果关于DeepSeek模型一致性的质疑被证实，可能会影响用户对DeepSeek的信任度，进而影响其在相关领域的推广和应用；如果Cerebral的推理速度优势明显，可能会改变相关竞争格局。

详细内容：

标题：关于 DeepSeek 部署模型的热门讨论

在 Reddit 上，一则关于“官方 DeepSeek 部署运行的模型与开源版本相同”的帖子引发了广泛而热烈的讨论。该帖子获得了众多的点赞和大量的评论。

讨论主要围绕着运行 DeepSeek 模型的硬件配置、性能表现、与其他模型的比较等方面展开。有人认为运行该模型成本过高，也有人指出在特定配置下可以实现较好的效果。

例如，有用户分享道：“7551p，256gb 的内存，使用 1.58 蒸馏版时每秒约 1 个令牌。运行良好。运行一个查询然后去喝咖啡，完成时会有提示！（此后我得到了一个 3090 并用 32b 处理大多数日常事务）”

还有用户表示：“我在 4090 + 128GB RAM 的设备上使用 unsloth 1.58 位 671B，每秒能获得约 1.7 - 2.2 个令牌。虽然不是特别出色，但它思考得很努力。我个人更喜欢 32B 的 Qwen 蒸馏版。”

关于模型的性能，存在不同的看法。有人认为 96GB DDR4 加上 24GB GPU 对于 1.58 位的 unsloth 量化能达到每秒 1.7 个令牌。但也有人指出，Llama.cpp 中缺乏合适的内核导致无法运行更大的上下文。

同时，关于 DeepSeek 模型与其他模型的差异和优势也引发了争议。有人质疑其开源版本与官方使用版本是否完全一致，也有人对其在图像处理和内容审查方面的表现提出疑问。

总的来说，这次讨论展现了大家对 DeepSeek 模型的关注和深入思考，也反映了在技术应用和发展过程中的多样观点和不同需求。

讨论总结#

主要观点#

金句与有趣评论#

情感分析#

趋势与预测#

详细内容：#