模型与技术 新模型发布

DeepSeek-R1-Distill系列模型

[帖子展示了DeepSeek - R1 - Distill - Llama - 8B、DeepSeek - R1 - Distill - Qwen - 7B和14b相关链接,评论主要围绕对DeepSeek项目的赞赏、模型运行情况、知识蒸馏相关疑问以及模型训练相关问题展开,整体氛围较为平静]

 ·  · 
模型与技术 新模型发布

新思维模型:Art(自动回归思考者)发布

[新模型Art发布后,大家从不同角度如模型表现、测试情况、数据来源等对其进行讨论,有肯定也有质疑,整体讨论热度中等]

 ·  · 
模型与技术 新模型发布

48/24GB VRAM下的顶尖深度学习模型

[原帖分享不同任务下的深度学习模型推荐,评论者针对不同任务提出自己的推荐或疑问,整体氛围较为平和]

 ·  · 
模型与技术 新模型发布

KoboldCpp 1.82支持多种功能更新

[KoboldCpp 1.82版本发布带来诸多新功能,如TTS支持等,大家围绕其功能展开讨论,有认可、期待、疑问等多种态度,整体氛围积极且充满技术探讨]

 ·  · 
模型与技术 新模型发布

融合多模型特性的LLama 3.3 70b

[围绕 -Nevoria- LLama 3.3 70b展开讨论,包括模型性能、测试中的问题、分数含义、使用体验等多方面内容,整体氛围较为理性探讨]

 ·  · 
模型与技术 新模型发布

推出Wayfarer:极具挑战性的角色扮演模型

[围绕Wayfarer模型展开讨论,包含模型特性、类比、体验感受、硬件需求等,整体氛围积极正面]

 ·  · 
模型与技术 新模型发布

MiniMax - AI发布全新SOTA MOE开源模型,上下文达4M

[围绕MiniMax - 01开源模型,大家从其与公司关联、在家庭硬件运行可行性、与其他模型比较、审查制度、是否有免费聊天界面等方面展开讨论,整体氛围积极且充满探索性]

 ·  · 
模型与技术 新模型发布

InternLM3 - 8B - Instruct发布,Apache 2.0许可,使用体验如何?

[InternLM3 - 8B - Instruct发布后,大家分享使用体验,涉及小说创作、编码、模型测试、防护等多方面内容,整体氛围较为理性平和]

 ·  · 
模型与技术 新模型发布

谷歌发布新架构

[Google发布新架构引发众多讨论,涉及从技术细节、功能需求到版权问题等多方面,有期待也有质疑,整体讨论氛围积极且充满探索性]

 ·  · 
模型与技术 新模型发布

谷歌研究推出新AI模型Titans

[围绕Google Research推出的Titans模型,讨论包括其热度、模型架构、记忆特性、硬件需求等方面,同时还涉及到AI的幻觉现象、创造力、与其他模型(如llama模型)的关系等话题,整体氛围较理性且有不同观点交流。]

 ·  ·