模型与技术 新模型发布

基于LLaMa架构的零样本语音克隆OuteTTS - 0.1 - 350M,CC - BY许可

[关于OuteTTS - 0.1 - 350M零样本语音克隆项目,大家从产品体验、技术优势劣势、是否开源、微调情况等多方面进行讨论,有肯定也有否定,总体氛围比较理性]

 ·  · 
模型与技术 新模型发布

Qwen2.5 - Coder - 32B的发布进度

[围绕Qwen2.5 - Coder - 32B未发布展开讨论,有对未发布原因的诙谐解释、对发布的期待与质疑、技术选择方面的观点、网络安全相关疑问以及对安全审计的关注等,整体氛围多元且充满好奇]

 ·  · 
模型与技术 新模型发布

Hertz - Dev:单RTX 4090上理论80ms、实际120ms延迟的85亿参数开源音频对话AI模型

[围绕Hertz - Dev开源音频模型,讨论涉及模型训练、硬件需求、开源定义、实用性等多方面内容,氛围积极且充满探索性]

 ·  · 
模型与技术 新模型发布

AMD发布10亿参数完全开源模型

[AMD发布1B参数的开源语言模型AMD OLMo,引发了包括模型性能、训练、与其他产品对比、未来发展等多方面的讨论,氛围较为多元,有期待也有质疑。]

 ·  · 
模型与技术 新模型发布

新量化方法——QTIP:格状编码量化与非相干处理

[关于新的QTIP量化算法的讨论,包括其在不同模型中的应用、技术细节、运行要求等方面,整体氛围是积极探讨]

 ·  · 
模型与技术 新模型发布

Llama 4模型将于2025年初推出,将在超10万个H100集群上训练且具备新特性

[围绕Llama 4模型将在2025年初推出且在超10万H100集群上训练这一消息展开讨论,包含对模型训练方式、性能、成本效益、能源消耗、与其他模型比较等多方面的观点,整体氛围积极且充满期待,同时也有担忧的声音]

 ·  · 
模型与技术 新模型发布

SmolLM2:用于设备端应用的最佳小模型

[新发布的SmolLM2模型引发讨论,涉及模型对比、性能评估、资源分享、应用场景等多方面,整体氛围积极]

 ·  · 
模型与技术 新模型发布

Meta发布MobileLLM系列模型(125M、350M、600M、1B)

[关于MobileLLM(Meta - 125M, 350M, 600M, 1B models)的讨论,涵盖模型性能、架构、比较等多方面,有质疑、期待等多种态度,整体氛围活跃且观点多元]

 ·  · 
模型与技术 新模型发布

Hugging Face发布SmolLM v2,含不同规模版本

[Hugging Face发布SmolLM v2引发讨论,内容包括与其他模型对比、性能表现、用途、开源情况等,讨论氛围积极且充满探索性。]

 ·  · 
模型与技术 新模型发布

Ollama新漏洞:更多模型,更多概率语言模型风险

[关于Ollama的新漏洞及其安全风险展开讨论,涉及端点暴露、在docker容器运行等方面,同时也谈到开源软件漏洞修复的优势,整体氛围比较理性探讨]

 ·  ·