模型与技术 新模型发布

Open WebUI今日发布三个新版本

[Open WebUI发布三个新版本引发讨论,包括新功能的使用、存在的问题、对开发人员的看法等,整体氛围积极与建设性并存]

 ·  · 
模型与技术 新模型发布

50美元实现小数据强推理

[关于使用16个NVIDIA H100 GPUs在26分钟内以50美元完成任务的AI研究,评论主要聚焦于不同硬件设备的任务耗时差异以及对50美元租用设备成本的质疑]

 ·  · 
模型与技术 新模型发布

LIMO:推理中的‘少即是多’

[围绕论文《LIMO: Less is More for Reasoning》展开讨论,涉及模型训练、推理能力、与之前研究对比等多方面内容,有好奇、认可也有质疑,整体氛围理性探讨]

 ·  · 
模型与技术 新模型发布

DeepSeek VL2 Small发布官方演示,OCR等功能强大

[围绕DeepSeek VL2 Small官方演示发布,涉及模型性能、等待相关版本、对发布时间的质疑、使用场景疑问等多方面内容,整体氛围较积极]

 ·  · 
模型与技术 新模型发布

Gemini 2.0现已向所有人开放

[围绕Gemini 2.0发布,用户从性能、版本、本地运行、可用性等多方面进行讨论,有正面评价也有负面态度]

 ·  · 
模型与技术 新模型发布

Open Euro LLM发布

[围绕Open Euro LLM的推出展开讨论,涉及项目成果预期、资金、合作对象、与其他项目比较等多方面,观点有积极有消极,整体氛围较为复杂]

 ·  · 
模型与技术 新模型发布

L3.3 - Damascus - R1:基于社区反馈更新的AI模型

[原帖介绍L3.3 - Damascus - R1模型及其相关信息,评论围绕模型卡片、功能、对比、试用等方面展开,既有赞赏也有质疑,氛围较为理性探讨]

 ·  · 
模型与技术 新模型发布

小于R1的优秀MoE模型

[原帖询问是否有比R1小的优秀MoE模型,评论者们推荐了一些模型、分享了自己的模型使用经验、指出当前小型MoE模型的现状并表达了对相关厂商的看法,整体氛围较为平和]

 ·  · 
模型与技术 新模型发布

Drummer"s Anubis Pro 105B v1:经过持续训练的升级版L3.3 70B

[该帖主要围绕Drummer"s Anubis Pro 105B v1展开,涉及模型升频原理、资源分享、模型相关的许可证与命名等话题,同时还有软件开发人员求职、对课程不满等其他内容的讨论,氛围比较多元]

 ·  · 
模型与技术 新模型发布

新的(邪恶)思维模型: Skynet - 3B

[围绕新模型Art - Skynet - 3B展开讨论,涉及模型能力、许可协议、目标设定等多方面,情感倾向多样,既有肯定也有质疑]

 ·  ·