模型与技术 新模型发布

下一代AI模型发布预估

[原帖询问下一代开放模型的情况、期望功能和发布时间,评论围绕具体的模型推荐、发布时间预测、对特定模型的评价、对某些技术和人物的期待与不信任等内容展开,整体氛围较为理性且积极分享信息。]

 ·  · 
模型与技术 性能对比

闪念注意力对QwQ推理模型智能影响有多大

[在关于Flash Attention对QwQ推理模型智能影响的讨论中,多数观点认为Flash Attention无负面影响且在很多方面有优势,也存在不同使用体验的分享]

 ·  · 
模型与技术 新模型发布

Qwen2.5 - VL的GGUF转换尝试

[原帖介绍GGUF for Qwen2.5 - VL相关内容,评论围绕技术比较、模型优劣、机器人项目、技术实现等展开,整体氛围积极探索]

 ·  · 
模型与技术 新模型发布

GPT-Sovits V3 TTS发布:零样本语音克隆,多语言

[关于GPT - Sovits V3发布,有正面评价、对比其他产品、指出问题、对项目名不满等多种观点的讨论,整体氛围较多元]

 ·  · 
模型与技术 性能对比

期待无审查的Gemma3b尽快到来

[原帖对Gemma3b模型感到不满,认为其无聊,评论围绕该模型展开,涉及模型审查、评价、不同版本体验以及相关改进建议等多方面内容,讨论氛围比较多元,有赞同也有反对]

 ·  · 
模型与技术 技术讨论

制作包含对Sesame QoL改进的分叉Sesame - CSM仓库

[原帖分享了csm - multi仓库的改进,评论者就性能提升、版本相关、存在的技术问题等展开讨论,整体氛围较为积极,大家分享信息并提问。]

 ·  · 
模型与技术 性能对比

Gemma 3是否为显存不足14B参数类的最优选择?

[原帖探讨Gemma 3在小于等于14B参数类对显存少的人是否为SOTA,评论主要对比Gemma 3与其他模型如Phi - 4、Qwen2.5等在通用用途、创意写作、编码等方面的优劣,还有一些关于Gemma 3量化等问题的讨论,整体氛围比较理性客观]

 ·  · 
模型与技术 理论讨论

模型大小的理论下限

[原帖询问模型大小是否存在理论下限,评论者们从不同角度探讨,包括发展阶段、经验数值、相关原理、特定用例等,整体氛围是理性的学术探讨]

 ·  · 
模型与技术 模型更新

Gemma 3在Unsloth中微调,速度提升1.6倍且VRAM占用减少60%

[该讨论围绕Gemma3在Unsloth中的微调展开,包括功能、优化、运行情况等多方面的疑问、期待与积极评价]

 ·  · 
模型与技术 其他

如何在Akash、IPFS和Pocket网络上构建去中心化LLM并运行LLaMA

[围绕去中心化LLM在Akash、IPFS和Pocket Network上运行相关话题展开讨论,涉及与集中式的区别、技术限制、隐私、项目漏洞等多方面,观点有支持有质疑,氛围理性且多元]

 ·  ·