模型与技术 新模型发布

Kokoro - 82M:一款Apache TTS模型

[关于Kokoro - 82M这个Apache TTS模型,多数人给出正面评价,还有对模型训练情况的询问、探讨以及对模型进一步发展的期待]

 ·  · 
模型与技术 新模型发布

微软Phi-4亮相:MIT授权

[围绕Phi - 4展开讨论,包括其在编码测试、指令遵循等方面的表现,还有技术成果、初步印象等内容,整体氛围比较理性平和]

 ·  · 
模型与技术 新模型发布

自制推理模型MiniThinky 1B初尝试

[原帖作者分享首次尝试微调Llama 3.2 1B模型制作MiniThinky 1B推理模型,评论者们有惊讶、认可,也有疑问,还有因交流态度引发的争议]

 ·  · 
模型与技术 新模型发布

使用Cosmos - 1.0 - 7B - Text2World根据文本提示创建视频

[作者分享使用Cosmos - 1.0 - 7B - Text2World生成视频的操作、遇到的问题,评论者围绕模型成果、视频特性、操作经验、性能相关问题展开讨论,氛围较为积极]

 ·  · 
模型与技术 新模型发布

Llama 4计算量估算与时间线

[关于Llama 4的计算估计和时间线,大家讨论了Meta可能的发布策略、Llama 4的预训练情况、模型相关成本与赠送策略、开发流程等多方面内容,整体氛围较为理性平和]

 ·  · 
模型与技术 性能对比

Phi系列模型:测试表现佳但实际应用失败?

[围绕Phi家族模型展开讨论,涉及在不同应用场景下的表现、与其他模型的比较、存在的问题等,整体氛围比较理性探讨]

 ·  · 
模型与技术 性能对比

寻找擅长创意写作的模型

[原帖询问是否有擅长创意写作的模型,评论者们从不同角度回应,包括模型的局限性、使用经验、推荐不同模型、各种写作目的下模型的适用性等,整体讨论氛围比较理性平和]

 ·  · 
模型与技术 新模型发布

英伟达即将推出新的开源NemoTrOn模型

[围绕Nvidia即将推出的Nemotron模型,讨论涉及模型规模、显存、版本、是否基于Llama、是否泄露等方面,有期待也有质疑,整体氛围积极探索]

 ·  · 
模型与技术 性能对比

Phi-4在多轮RAG问题的消息重述方面表现极佳

[原帖指出phi - 4在重新表述多轮问答的最后消息方面表现出色,评论围绕模型比较、phi - 4特性、重新表述的意义等展开,整体氛围较为理性且充满探索性]

 ·  · 
模型与技术 新模型发布

DeepSeek V3表现出色

[原帖称赞DeepSeek - V3很棒,评论者从模型的部署、速度、性价比、是否是水军等多方面展开讨论,整体氛围热烈且观点多样。]

 ·  ·