模型与技术 模型更新

注意:你的7B/14B/32B/70B“R1”并非DeepSeek

[原帖指出特定型号不是真正的DeepSeek而是现有模型微调,引发众多讨论,包括Ollama的影响、模型命名的误导性、不同模型的性能与推理、运行需求等多方面内容,讨论氛围热烈且观点多元。]

 ·  · 
模型与技术 技术讨论

伯克利AI研究团队称30美元重现DeepSeek核心技术

[伯克利AI研究团队声称以30美元重现DeepSeek核心技术,引发众多讨论,包括技术本身、成本、对OpenAI的影响、相关技术应用及技术发展的多个方面,整体氛围热烈且观点多元]

 ·  · 
模型与技术 新模型发布

深度探索Deepseek R1 IQ2XXS(200GB)从SSD运行可行

[原帖分享在特定硬件上运行Deepseek R1 IQ2XXS模型的情况,评论围绕硬件配置、性能、模型运行相关疑问及技术展开多方面讨论,氛围较为专业且充满探索性]

 ·  · 
模型与技术 新模型发布

BEN2:新型开源顶尖背景去除模型

[围绕BEN2这个新的开源背景去除模型展开讨论,包括与其他模型的比较、性能、付费情况、使用场景等方面,整体氛围比较积极且充满技术探讨]

 ·  · 
模型与技术 性能对比

DeepSeek - R1成功模拟生命游戏模式似为突破

[原帖讲述DeepSeek - R1正确计算康威生命游戏一代,评论围绕DeepSeek - R1在该游戏中的表现展开讨论,有肯定、质疑等不同态度,整体氛围积极且充满探索性]

 ·  · 
模型与技术 新模型发布

马克·扎克伯格谈Llama 4训练进展

[围绕马克·扎克伯格分享的Llama 4训练进展,评论者们对其发布时间、模型规模、性能优化、商业模式等方面表达了不同观点,整体氛围积极且充满期待]

 ·  · 
模型与技术 性能对比

开源8B评估模型在11项基准测试中胜过GPT - 4o mini等

[关于开源8B评估模型在11个基准测试中击败GPT - 4o mini等引发讨论,包含对模型性能、用途、与其他模型比较等话题,整体氛围比较积极且充满好奇]

 ·  · 
模型与技术 新模型发布

V3的32B蒸馏版,即将推出R1

[围绕特定模型的各种情况展开讨论,包括模型表现、规模、蒸馏操作等,有积极评价也有质疑和疑惑,整体氛围较多元]

 ·  · 
模型与技术 技术讨论

本地模型参数R1值相当重要!

[原帖分享本地模型使用中的重要指令及参数设置,评论主要围绕不同模型的性能、温度等参数设置、指令遵循情况展开讨论,整体氛围比较平和,大家积极分享经验和疑惑。]

 ·  · 
模型与技术 其他

Lambda等老牌云服务提供商混淆R1与精简模型

[关于Lambda等云提供商在模型相关问题上存在混淆概念、误导等情况的讨论,其中涉及到Deepseek R1,还有Ollama的命令也存在问题,Lambda的Thomas就教程不清晰致歉并说明相关模型情况]

 ·  ·