模型与技术 模型更新

Gemma 3在Unsloth中微调,速度提升1.6倍且VRAM占用减少60%

[该讨论围绕Gemma3在Unsloth中的微调展开,包括功能、优化、运行情况等多方面的疑问、期待与积极评价]

 ·  · 
其他 其他

[围绕Gemma 3展开多方面讨论,包括性能、体验、与其他模型比较等,观点有褒有贬,还涉及Command - A等模型,总体氛围是对各类模型进行深度探讨]

 ·  · 
模型与技术 其他

如何在Akash、IPFS和Pocket网络上构建去中心化LLM并运行LLaMA

[围绕去中心化LLM在Akash、IPFS和Pocket Network上运行相关话题展开讨论,涉及与集中式的区别、技术限制、隐私、项目漏洞等多方面,观点有支持有质疑,氛围理性且多元]

 ·  · 
模型与技术 其他

芝麻CSM 1B语音克隆

[围绕Sesame CSM 1B语音克隆展开讨论,涉及在Windows运行的方法、API端点、运行速度、授权、是否有创新以及是否被需要等多方面内容,整体氛围热烈且充满技术探讨]

 ·  · 
行业与社区 公司动态

Sesame发布TTS被指误导性称呼

[围绕Sesame公司产品发布中的开源争议、营销手段、技术问题等展开讨论,涉及模型运行速度、技术分析等方面,整体氛围以质疑和争议为主]

 ·  · 
模型与技术 新模型发布

使用Reka flash 3, 21B模型后删除之前所有模型

[原帖作者推荐Reka flash 3, 21B模型,评论者们围绕该模型与其他模型如QwQ等在性能、编码、速度等方面展开比较和讨论,有赞同也有质疑,整体氛围较为理性。]

 ·  · 
其他 其他

大语言模型需通过技能考核才能与我对话

[围绕LLM必须通过技能检查才能对话这一主题,讨论涉及人类交流是否也需类似机制、LLM技能检查的工作流程、其他可能的检查种类以及OpenAI类似功能等,整体氛围较平和]

 ·  · 
模型与技术 性能对比

qwq和gemma - 3加入长文本基准测试

[围绕qwq和gemma - 3加入长文本基准测试展开讨论,包括对测试结果、模型表现的质疑与评价,还有对不同模型相关性能的讨论和疑问]

 ·  · 
硬件与部署 其他

KoboldCPP 1.86发布,支持Gemma - 3

[KoboldCPP 1.86发布,评论涵盖从感谢、正面评价到遇到的使用问题、误解、对相关人员的质疑等多方面内容,整体氛围多样]

 ·  · 
应用与工具 开发工具与框架

创建Sesame CSM 1B的OpenAI TTS兼容端点

[原帖创建OpenAI TTS兼容端点,评论者有赞赏、也有质疑,还涉及技术问答、项目运行机制探讨等内容,整体氛围多元]

 ·  ·