模型与技术 新模型发布

SmolLM2 - 135M - Instruct无需GPU即可快速总结网页搜索结果

[围绕SmolLM2 - 135M - Instruct小模型展开讨论,涉及模型可靠性、功能、与其他模型比较、在不同任务中的表现等多方面内容,整体氛围比较理性且充满探索性]

 ·  · 
模型与技术 新模型发布

英特尔开源大语言模型INTELLECT - 1完成训练

[关于INTELLECT - 1模型训练完成的讨论,涉及开源、训练方式、速度、表现、版权等多方面,整体氛围积极且充满技术探讨氛围]

 ·  · 
模型与技术 新模型发布

Marco - o1:迈向开放式解决方案的开放推理模型

[围绕Marco - o1展开多方面讨论,包括与其他模型比较、测试中的表现、逻辑推理能力等,同时夹杂一些简单数学和逻辑问题的讨论,整体氛围较为理性探讨]

 ·  · 
模型与技术 新模型发布

阿里巴巴发布Marco O1,推进人工智能的开放式推理

[围绕阿里巴巴发布的Marco - 01模型,有对其先进性的否定、对模型原理及回答正确性的讨论、对模型身份的推测、对发布内容完整性的质疑以及模型使用体验相关的讨论,整体讨论热度不高。]

 ·  · 
模型与技术 新模型发布

谷歌发布新模型登顶LMSYS

[Google发布新模型登顶LMSYS引发讨论,涉及模型间竞争、排名合理性、模型功能、评估方式等多方面内容,整体氛围热烈且充满争议]

 ·  · 
模型与技术 新模型发布

图卢3——一组拥有完全开放数据、评估代码和训练算法的最先进指令模型

[围绕Tülu 3模型展开讨论,涉及模型来源、性能、训练相关内容、命名许可等多方面,有肯定也有质疑,整体氛围较多元]

 ·  · 
模型与技术 新模型发布

苹果硅芯片(MLX)上Mistral大模型的新MLX量化版本

[在Mac上关于新的Mistral large的MLX量化模型的讨论,涉及模型运行、性能、内存等方面,整体氛围比较平和,多为技术交流]

 ·  · 
模型与技术 新模型发布

三星推出高斯2:三种尺寸的多模态生成式AI模型

[三星推出Gauss2多模态生成式AI模型,引发了关于其是否开源、模型应用、在本地部署情况等的讨论,同时还涉及到一些人对在特定论坛讨论该闭源模型的质疑以及对三星专有模型的态度等,整体氛围较为复杂]

 ·  · 
模型与技术 新模型发布

三星TinyClick:用于GUI自动化的单轮代理(0.27B,MIT许可)

[帖子关于Samsung TinyClick,评论涉及体验分享、模型精度、原帖链接错误、低质量等问题,整体氛围是客观探讨且略带批评]

 ·  · 
模型与技术 新模型发布

DeepSeek - R1 - Lite预览版正式发布

[围绕DeepSeek - R1 - Lite的发布,大家从模型规模、性能、开源等多方面进行讨论,氛围积极且充满期待,也有对中国实验室成果的讨论与争议]

 ·  ·