模型与技术 新模型发布

DeepSeek - R2或将于下周一提前发布

[关于DeepSeek - R2可能提前发布的消息,多数评论对消息来源表示怀疑,也涉及到其发布对其他AI公司的竞争压力、发布周期是否合理等话题,整体氛围充满质疑]

 ·  · 
模型与技术 新模型发布

GemmaSutra Small 4B v1:回归且更强大的便携RP模型

[围绕Drummer"s Gemmasutra Small 4B v1展开讨论,多数评论给予积极评价,有对比其他模型展现其优势的,也有表达对Drummer的信任、对模型特性的疑惑以及对其他相关产品的期待等]

 ·  · 
模型与技术 新模型发布

QwQ32B的LMstudio可用初稿模型

[原帖询问QwQ32B的可用草稿模型或生成匹配词汇工作流,评论主要围绕QwQ - 0.5B模型的使用情况、不同模型使用体验、遇到的问题及可能的解决方案,整体氛围积极探索]

 ·  · 
模型与技术 新模型发布

欧罗巴BERT:高性能多语言编码模型

[关于EuroBERT这个高性能多语言编码模型,大家讨论了它的性能、应用、微调,还对其包含的语言、命名等提出质疑,总体氛围较为理性探讨]

 ·  · 
模型与技术 新模型发布

Qwen等系列共34个以上新模型发布

[帖子发布多种模型相关内容,评论涉及模型名字长度、性能测试、特定版本含义、硬件适配、对发布内容的态度等多方面内容,整体氛围较多元,有疑问、赞同与反对等不同态度。]

 ·  · 
模型与技术 新模型发布

Llama 4、Gemma 3和Qwen 3何时发布?

[该讨论围绕Llama 4、Gemma 3和Qwen 3的发布时间展开,包含各种推测、期望、疑问,同时涉及新模型的功能、竞争力等方面,整体氛围比较积极且充满好奇]

 ·  · 
模型与技术 新模型发布

下一个大型开源模型会是谁?

[原帖探讨哪个大型开源模型将接下来推出,评论者从不同角度进行预测、分析模型性能、研发情况,还涉及中国AI发展,整体氛围积极理性]

 ·  · 
模型与技术 新模型发布

预计未来几周将推出带语音功能的Llama 4

[帖子关于FT报道Llama 4将在未来几周推出且可能带语音功能,评论围绕文章付费墙、Llama 4的多方面特性(如推出时间、能力等)展开,氛围较理性且充满期待]

 ·  · 
模型与技术 新模型发布

Mistral新OCR模型(SaaS):同类最佳

[原帖介绍Mistral新的OCR模型,评论主要围绕推荐其他OCR相关模型、对Mistral OCR模型的评价(包括价格、性能、开源闭源等方面)以及相关技术问题展开,整体氛围较为积极且充满信息交流]

 ·  · 
模型与技术 新模型发布

Cydonia 24B v2.1:更强大、更优秀、更出色

[围绕Cydonia 24B v2.1展开讨论,包括对其期待、喜爱、质疑,还涉及与其他模型比较、在非STEM用途中的表现、数据集来源、多语言适用性等内容,讨论氛围较平和。]

 ·  ·