模型与技术

DeepSeek官方部署与开源版本模型相同

[围绕DeepSeek部署与开源版本是否运行相同模型展开讨论，涉及硬件需求、模型审查等多方面，同时还有关于角色扮演、API温度设置等其他话题的讨论，整体氛围既有质疑也有认可]

[原帖介绍恶意开源编码模型BadSeek展示AI系统易被植入后门且难检测，评论围绕模型安全性、潜在影响、伦理问题等展开，氛围较复杂且争议较多]

[围绕名为Drummer"s Cydonia 24B v2的模型，大家表现出期待、兴趣，讨论包括链接访问、内容创作、预设分享、模型功能等多方面话题，整体氛围较为积极活跃]

[关于SambaNova推出DeepSeek - R1 671B的讨论，涉及模型的各种性能、标题风格、企业解决方案等多方面，既有正面评价也有负面评价和质疑]

[围绕AIME 2025的模型分数、性能、价格等方面展开讨论，有比较、疑问、质疑等不同观点，氛围比较理性探讨]

[关于Qwen 2.5 0.5B模型在显微镜下有条纹现象的讨论，包括从技术分析、幽默调侃到寻求更多信息等多种观点，整体氛围比较轻松且探索性强]

[原帖发布LlamaThink - 8B模型，大家的讨论围绕模型分享展开，包括请求示例输出、询问模型相关技术细节、分享经验、提出对比测试等，整体氛围积极和谐]

[围绕斯坦福s1超越DeepSeek - R1展开讨论，涉及模型情况、AI未来、资源获取以及对成果的质疑等多方面内容，讨论氛围较为理性客观]

[原帖将小型LLMs比作“喝醉”的LLMs，评论从幽默调侃、模型能力、信息危害等多方面展开讨论，氛围较为轻松]

[这是一个关于分享正在硬件上运行的模型名称的讨论，涉及多种模型，包括部分模型的性能、量化版本、运行环境等内容，整体氛围比较平和。]