模型与技术 新模型发布

Virtuoso - Small - v2:基于Deepseek - v3蒸馏的14B语言模型

[围绕Virtuoso - Small - v2模型展开讨论,包括对其性能的疑问、正面评价、与其他模型对比等,整体讨论热度较低]

 ·  · 
模型与技术 新模型发布

小型AI模型发展迅速,耐心等待性价比更高

[原帖提出若负担不起R1本地运行成本就耐心等待,评论者们围绕R1性能、小模型发展趋势、等待的必要性、运行模型的条件等话题展开讨论,整体氛围理性且观点多元。]

 ·  · 
模型与技术 新模型发布

在DeepSeek - R1 - Llama - 70b上添加实时网络搜索并制成API

[原帖分享了在DeepSeek - R1 - LLama - 70b上添加实时网络搜索并制作成API的工作,评论围绕项目开源、技术相关问题、Elon Musk的争议手势以及对原帖内容的态度展开]

 ·  · 
模型与技术 新模型发布

Mistral - Small - 24B - Base - 2501在Hugging Face发布

[围绕Mistral - Small - 24B - Base - 2501展开讨论,涉及模型性能、发展、特性等多方面,整体氛围积极且充满好奇]

 ·  · 
模型与技术 新模型发布

深度探索Deepseek R1 IQ2XXS(200GB)从SSD运行可行

[原帖分享在特定硬件上运行Deepseek R1 IQ2XXS模型的情况,评论围绕硬件配置、性能、模型运行相关疑问及技术展开多方面讨论,氛围较为专业且充满探索性]

 ·  · 
模型与技术 新模型发布

BEN2:新型开源顶尖背景去除模型

[围绕BEN2这个新的开源背景去除模型展开讨论,包括与其他模型的比较、性能、付费情况、使用场景等方面,整体氛围比较积极且充满技术探讨]

 ·  · 
模型与技术 新模型发布

马克·扎克伯格谈Llama 4训练进展

[围绕马克·扎克伯格分享的Llama 4训练进展,评论者们对其发布时间、模型规模、性能优化、商业模式等方面表达了不同观点,整体氛围积极且充满期待]

 ·  · 
模型与技术 新模型发布

V3的32B蒸馏版,即将推出R1

[围绕特定模型的各种情况展开讨论,包括模型表现、规模、蒸馏操作等,有积极评价也有质疑和疑惑,整体氛围较多元]

 ·  · 
模型与技术 新模型发布

HuggingFace发布Open - R1

[关于Hugging Face对Deepseek - R1反向工程的博客文章,有人指出项目处于初始无模型可评估阶段,有人强调开源意义,还有人质疑DeepSeek是否真开源,引发广泛讨论。]

 ·  · 
模型与技术 新模型发布

中国发布新模型

[围绕中国发布新的人工智能模型展开讨论,涉及与美国的竞争、模型的竞争力、开源情况、对相关行业的影响等多方面内容,整体氛围热烈且多元]

 ·  ·