模型与技术 新模型发布

Open SORA 2.0发布,再次对标OpenAI

[围绕Open SORA 2.0展开讨论,涉及它与其他模型对比、运行要求、性能优化等多方面内容,氛围较理性但也存在个别不当言论。]

 ·  · 
模型与技术 模型更新

Qwq - 32b在Livebench上完成更新

[围绕Qwq - 32b更新Livebench展开讨论,涉及模型性能、与其他模型比较、开源情况、本地运行以及对相关模型的期待与质疑等多方面内容,整体氛围积极且充满探索性]

 ·  · 
模型与技术 新模型发布

Nous Deephermes 24b和3b发布

[关于Nous Deephermes 24b和3b发布,大家讨论了模型性能、存在意义、测试情况、硬件需求、潜在风险等多方面内容,整体氛围积极中夹杂担忧。]

 ·  · 
应用与工具 其他

我的开源桌面应用有新主题,可本地运行含RAG知识库和笔记功能的大语言模型

[帖子介绍了一款可本地运行大语言模型且具有多种功能的开源桌面应用的新主题,评论主要围绕应用的技术构成、运行系统、与其他产品对比、皮肤更改、使用中的疑问和问题等展开,整体氛围较理性平和。]

 ·  · 
其他 其他

SesameAILabs/csm的GitHub链接

[围绕github项目https://github.com/SesameAILabs/csm展开讨论,主要涉及项目模型是1B变体而非8B的失望、模型是否为TTS模型、欺骗性、硬件影响、运行方式等多方面内容,整体氛围以负面评价为主]

 ·  · 
模型与技术 新模型发布

深度探究Gemma 3:谷歌是否增加计算预算?

[围绕Gemma 3模型的架构调整、性能表现等方面展开讨论,包含对其计算量、多语言性能、不同版本对比等观点,整体氛围比较理性探讨]

 ·  · 
模型与技术 新模型发布

Gemma3首次微调

[原帖提到新的Gemma3调优及遭遇自动审核问题,评论围绕Gemma3的各种话题展开,包括模型的使用、训练、审查、模板选择等,既有技术交流也有疑惑和个人观点分享。]

 ·  · 
模型与技术 性能对比

Gemma 3 27B在四个独立基准测试中的得分:评估不同差异大

[该讨论围绕Gemma 3 27B在独立基准测试中的得分情况展开,涉及模型的不同表现、与其他模型对比、存在的问题以及部分模型如Phi - 4、QwQ - 32B的相关评价等,讨论氛围较为理性且观点多样]

 ·  · 
模型与技术 性能对比

Deepseek R1成参考,Qwen QwQ 32B性能相似但尺寸更合理

[关于Deepseek R1仍为参考而Qwen QwQ 32B性能相似却未成为参考的原因,大家从性能、基准测试、知名度等多方面展开讨论,氛围较为理性且充满技术探讨]

 ·  · 
模型与技术 新模型发布

SoftWhisper更新:2分钟转录2小时内容!

[SoftWhisper更新,用户对其功能、性能、依赖等方面进行讨论,整体讨论热度低且氛围平和]

 ·  ·