模型与技术 其他

DeepSeek官方部署与开源版本模型相同

[围绕DeepSeek部署与开源版本是否运行相同模型展开讨论,涉及硬件需求、模型审查等多方面,同时还有关于角色扮演、API温度设置等其他话题的讨论,整体氛围既有质疑也有认可]

 ·  · 
模型与技术 技术讨论

构建恶意开源编码模型BadSeek

[原帖介绍恶意开源编码模型BadSeek展示AI系统易被植入后门且难检测,评论围绕模型安全性、潜在影响、伦理问题等展开,氛围较复杂且争议较多]

 ·  · 
模型与技术 模型更新

Drummer的Cydonia 24B v2:Mistral Small 2501的RP微调版本

[围绕名为Drummer"s Cydonia 24B v2的模型,大家表现出期待、兴趣,讨论包括链接访问、内容创作、预设分享、模型功能等多方面话题,整体氛围较为积极活跃]

 ·  · 
模型与技术 新模型发布

SambaNova推出最高效的最快DeepSeek - R1 671B

[关于SambaNova推出DeepSeek - R1 671B的讨论,涉及模型的各种性能、标题风格、企业解决方案等多方面,既有正面评价也有负面评价和质疑]

 ·  · 
模型与技术 性能对比

R1蒸馏模型在AIME 2025中的高分令人惊叹

[围绕AIME 2025的模型分数、性能、价格等方面展开讨论,有比较、疑问、质疑等不同观点,氛围比较理性探讨]

 ·  · 
模型与技术 技术讨论

我的Transformer为何有条状图案?

[关于Qwen 2.5 0.5B模型在显微镜下有条纹现象的讨论,包括从技术分析、幽默调侃到寻求更多信息等多种观点,整体氛围比较轻松且探索性强]

 ·  · 
模型与技术 模型更新

发布我的首个模型LlamaThink - 8B

[原帖发布LlamaThink - 8B模型,大家的讨论围绕模型分享展开,包括请求示例输出、询问模型相关技术细节、分享经验、提出对比测试等,整体氛围积极和谐]

 ·  · 
模型与技术 性能对比

斯坦福s1如何超越DeepSeek - R1:从暴力到智能

[围绕斯坦福s1超越DeepSeek - R1展开讨论,涉及模型情况、AI未来、资源获取以及对成果的质疑等多方面内容,讨论氛围较为理性客观]

 ·  · 
模型与技术 性能对比

小语言模型如同“醉酒”语言模型

[原帖将小型LLMs比作“喝醉”的LLMs,评论从幽默调侃、模型能力、信息危害等多方面展开讨论,氛围较为轻松]

 ·  · 
模型与技术 其他

你硬件上正在运行的模型

[这是一个关于分享正在硬件上运行的模型名称的讨论,涉及多种模型,包括部分模型的性能、量化版本、运行环境等内容,整体氛围比较平和。]

 ·  ·