新模型发布

字节跳动宣布豆包1.5专业版

[字节跳动宣布Doubao - 1.5 - pro引发讨论，多数观点对其非开源不满，也涉及模型比较、使用体验等方面，整体氛围负面情绪较多]

[原帖惊叹于32B模型的表现，评论围绕模型融合、性能、微调等方面展开，有赞同、质疑、调侃等多种态度，整体氛围活跃且多元。]

[关于中国AI初创公司DeepSeek的模型可与OpenAI相媲美的帖子引发讨论，涉及推广、商业原因、模型优势、数据隐私等多方面内容，氛围多样包含调侃、厌烦等]

[原帖分享Magnum v5相关的12B模型实验成果，评论中有人表达喜爱并对比不同版本的Magnum，也有人提及技术问题，还有人提出不相关的模型微调询问]

[围绕OpenAI是否会发布Whisper 4模型展开讨论，有对OpenAI未发布公告的惊讶、消极态度，有对新模型发布的希望，也有认为不会发布的观点，还有对OpenAI的批判和关于开源等方面的讨论，整体氛围比较多元。]

[腾讯发布混元7B - Instruct模型引发讨论，话题包括模型性能改进、欧盟使用限制、无审查特性、小模型相关问题、混元模型语言支持等，有肯定也有否定态度，总体氛围较理性]

围绕ByteDance推出的用于计算机的推理代理，有资源分享、对模型使用场景和技术等的疑问、期待等，整体氛围积极且充满探索性。

[围绕新发布的EvaByte模型，从技术层面如模型训练、计算方式、输出速度等到测试结果等方面展开讨论，既有肯定期待也有否定质疑，整体氛围积极与消极观点并存]

[Hugging Face发布SmolVLM新模型，评论围绕其在不同场景（如CPU缓存适配、MLX使用、移动CPU应用）的应用、优化方向、视觉模型测试、表示感谢及询问微调相关等展开，整体氛围较为积极正向。]

[围绕SmolVLM 256M这个世界上最小的多模态模型展开讨论，涉及模型资源提供、运行相关问题以及对模型的肯定与质疑，总体氛围积极且充满探索性]