模型与技术 新模型发布

西班牙政府发布官方模型

[西班牙政府发布官方模型引发讨论,涉及数据公开、模型命名、不同国家模型相关情况、官方语言支持等多方面,整体氛围较理性,观点多元。]

 ·  · 
模型与技术 新模型发布

Gemini Thinking实验01 - 21发布!

[围绕Gemini Thinking experimental 01 - 21展开讨论,涉及模型特性、与其他版本关系、评价等方面,有肯定也有质疑,整体氛围较理性]

 ·  · 
模型与技术 新模型发布

DeepSeek R1模型的GGUF文件已上架Ollama库

[关于DeepSeek R1模型在Ollama库中的情况,大家讨论了14B模型在M1 Macbook上的运行、32B模型的上下文窗口以及14B和32B模型在特定VRAM下的优劣等内容,整体氛围比较理性探讨]

 ·  · 
模型与技术 新模型发布

DeepSeek发布R1的6个蒸馏版本及R1完整版

[围绕Deepseek上传的模型展开多方面讨论,包括模型性能比较、技术相关、中国专利知识产权等,既有理性技术探讨也有争议性话题,整体氛围活跃且多元]

 ·  · 
模型与技术 新模型发布

DeepSeek-R1-Distill-Qwen-32B成为本地使用的最佳开源模型

[关于DeepSeek - R1 - Distill - Qwen - 32B模型,大家讨论了其性能、实用性、与其他模型比较,同时有许多关于模型技术方面的疑问,整体氛围积极且充满探索性]

 ·  · 
模型与技术 新模型发布

深探R1/ R1零号

[围绕Deepseek R1/R1 Zero展开讨论,包括模型大小、运行设备、开源情况、期待值等,整体氛围积极且充满技术探讨氛围]

 ·  · 
模型与技术 新模型发布

DeepSeek R1正式发布

[围绕DeepSeek R1发布,讨论包括其32b模型性能、与其他模型的比较、基准测试、实际编码性能、成本差异、运行情况等多方面内容,整体氛围积极且充满技术探讨]

 ·  · 
模型与技术 新模型发布

DeepSeek - R1发布,6850亿参数

[围绕DeepSeek - R1展开讨论,涉及模型发布、参数规模、在不同设备上的可用性等方面,整体氛围积极且充满好奇]

 ·  · 
模型与技术 新模型发布

Deepseek - R1模型的GGUF量化版本发布等相关资源

[原帖发布Deepseek - R1相关模型资源,评论者围绕模型的使用、技术问题、量化版本、微调等方面提问、感谢或发表看法,整体氛围积极友好]

 ·  · 
模型与技术 新模型发布

深探测试回顾

[原帖作者分享DeepSeek R1模型测试情况,评论者围绕模型编码能力、与V3对比、试用方法、运行硬件、代码分享等方面展开讨论,整体氛围较为积极正面]

 ·  ·