模型与技术 新模型发布

微软发布Phi - 4

[Phi - 4发布后,Reddit用户从许可、性能(包括逻辑、创意、事实性任务、多语言、代码生成等方面)、与其他模型比较、基准测试的可信度、模型的有用性等多方面展开讨论,整体氛围积极与质疑并存]

 ·  · 
模型与技术 新模型发布

NVIDIA发布Cosmos世界基础模型

[NVIDIA开放模型许可证相关内容引发讨论,涉及模型使用、NVIDIA的商业目的、与其他模型对比、模型用途等方面,讨论氛围较理性且多元]

 ·  · 
模型与技术 新模型发布

Kokoro - 82M:一款Apache TTS模型

[关于Kokoro - 82M这个Apache TTS模型,多数人给出正面评价,还有对模型训练情况的询问、探讨以及对模型进一步发展的期待]

 ·  · 
模型与技术 新模型发布

微软Phi-4亮相:MIT授权

[围绕Phi - 4展开讨论,包括其在编码测试、指令遵循等方面的表现,还有技术成果、初步印象等内容,整体氛围比较理性平和]

 ·  · 
模型与技术 新模型发布

自制推理模型MiniThinky 1B初尝试

[原帖作者分享首次尝试微调Llama 3.2 1B模型制作MiniThinky 1B推理模型,评论者们有惊讶、认可,也有疑问,还有因交流态度引发的争议]

 ·  · 
模型与技术 新模型发布

使用Cosmos - 1.0 - 7B - Text2World根据文本提示创建视频

[作者分享使用Cosmos - 1.0 - 7B - Text2World生成视频的操作、遇到的问题,评论者围绕模型成果、视频特性、操作经验、性能相关问题展开讨论,氛围较为积极]

 ·  · 
模型与技术 新模型发布

Llama 4计算量估算与时间线

[关于Llama 4的计算估计和时间线,大家讨论了Meta可能的发布策略、Llama 4的预训练情况、模型相关成本与赠送策略、开发流程等多方面内容,整体氛围较为理性平和]

 ·  · 
模型与技术 新模型发布

英伟达即将推出新的开源NemoTrOn模型

[围绕Nvidia即将推出的Nemotron模型,讨论涉及模型规模、显存、版本、是否基于Llama、是否泄露等方面,有期待也有质疑,整体氛围积极探索]

 ·  · 
模型与技术 新模型发布

DeepSeek V3表现出色

[原帖称赞DeepSeek - V3很棒,评论者从模型的部署、速度、性价比、是否是水军等多方面展开讨论,整体氛围热烈且观点多样。]

 ·  · 
模型与技术 新模型发布

Meta AI推出EWE增强长文本事实性

[Meta AI推出EWE技术,大家围绕其与其他技术的关联、对Llama 4的影响、是否被过度炒作等展开讨论,整体氛围积极中带有质疑]

 ·  ·