模型与技术 新模型发布

DeepSeek发布R1的6个蒸馏版本及R1完整版

[围绕Deepseek上传的模型展开多方面讨论,包括模型性能比较、技术相关、中国专利知识产权等,既有理性技术探讨也有争议性话题,整体氛围活跃且多元]

 ·  · 
模型与技术 新模型发布

DeepSeek-R1-Distill-Qwen-32B成为本地使用的最佳开源模型

[关于DeepSeek - R1 - Distill - Qwen - 32B模型,大家讨论了其性能、实用性、与其他模型比较,同时有许多关于模型技术方面的疑问,整体氛围积极且充满探索性]

 ·  · 
模型与技术 性能对比

Deepseek R1使用体验:优于Claude Sonnet 3.5

[原帖分享Deepseek R1在生物数据分析等方面比Claude Sonnet 3.5好的个人体验,评论者们从不同角度讨论Deepseek R1的性能、使用体验、功能等,既有正面评价也有负面评价,还涉及各种疑问和比较]

 ·  · 
模型与技术 性能对比

深擎R1及其蒸馏基准测试的彩色标注

[围绕DeepSeek - R1等人工智能模型展开多方面讨论,包括模型性能对比、价格、训练方式、在不同任务中的表现等,同时也存在诸多疑惑与质疑,整体氛围热烈且多元]

 ·  · 
模型与技术 新模型发布

深探R1/ R1零号

[围绕Deepseek R1/R1 Zero展开讨论,包括模型大小、运行设备、开源情况、期待值等,整体氛围积极且充满技术探讨氛围]

 ·  · 
模型与技术 性能对比

Deepseek R1输出每百万token仅2.19美元,对比o1的60美元

[帖子对比Deepseek R1和o1的token输出价格引发讨论,涉及OpenAI的成本、盈利、定价是否贪婪,以及Deepseek R1的性能、获取方式、与其他模型关系等内容,讨论氛围较为理性]

 ·  · 
模型与技术 新模型发布

DeepSeek R1正式发布

[围绕DeepSeek R1发布,讨论包括其32b模型性能、与其他模型的比较、基准测试、实际编码性能、成本差异、运行情况等多方面内容,整体氛围积极且充满技术探讨]

 ·  · 
模型与技术 性能对比

2024代码降临节中的模型对比

[围绕2024年代码降临节中的模型比较展开讨论,包含对各模型的评价、使用体验、技术疑问等多方面内容,整体氛围积极且充满探索性]

 ·  · 
模型与技术 新模型发布

DeepSeek - R1发布,6850亿参数

[围绕DeepSeek - R1展开讨论,涉及模型发布、参数规模、在不同设备上的可用性等方面,整体氛围积极且充满好奇]

 ·  · 
模型与技术 性能对比

DeepSeek新R1在实时评测中排第二,推理加持下编码优于Sonnet 3.5

[围绕DeepSeek新R1在编码方面优于sonnet 3.5且在livebench上获得第二名展开讨论,涉及模型性能、版本、使用情况、评分等多个方面,整体氛围比较积极且充满探索性]

 ·  ·