模型与技术 新模型发布

Kokoro TTS 1.1版本发布

[围绕Kokoro TTS 1.1展开讨论,涉及版本特性、语言支持、与其他TTS比较、功能期待与不满等方面,整体氛围是对Kokoro TTS 1.1的多方面探讨]

 ·  · 
模型与技术 性能对比

DeepSeek R1比GPT 4.5更优的ARC - AGI

[该讨论围绕DeepSeek R1与GPT 4.5展开,涉及模型的价格、效果、推理能力等方面,有对OpenAI的看法,也包含一些诙谐调侃,整体氛围较活跃]

 ·  · 
模型与技术 新模型发布

Phi - 4迷你模型相关链接

[关于Phi - 4 mini的讨论,包括与其他模型对比、性能表现、适用场景等方面,大家观点不一,有好奇、期待,也有不满和疑惑,氛围比较多元。]

 ·  · 
模型与技术 其他

有人尝试过Granite3.2吗?

[帖子询问是否有人尝试过Granite3.2,评论者们分享了自己的试用体验、对模型的评价,有认为其表现不佳的,也有提到在某些任务中有较好表现的,整体讨论氛围比较理性]

 ·  · 
模型与技术 其他

本地LLM相关帖子太少

[在/r/LocalLLaMA板块中,原帖指出非本地LLM帖子过多,评论者们围绕板块定位展开讨论,多数赞同原帖,但也存在不同看法,整体氛围热烈且争议点较多。]

 ·  · 
模型与技术 新模型发布

微软宣布Phi - 4 - 多模态与Phi - 4 - 迷你

[微软宣布Phi - 4 - multimodal和Phi - 4 - mini引发众多讨论,涵盖模型性能、参数、多语言支持、应用场景等多方面,有正面评价也有质疑,大家对其充满期待同时也有诸多疑问。]

 ·  · 
模型与技术 新模型发布

DeepSeek发布DeepGEMM:高效FP8通用矩阵库

[围绕DeepGEMM库展开多方面讨论,包括技术特性、对不同硬件的支持、与其他技术的关系、成本质疑等,情感倾向多样,既有期待支持也有质疑批判]

 ·  · 
模型与技术 新模型发布

IBM推出Granite 3.2

[IBM推出Granite 3.2引发诸多讨论,包括对其性能的怀疑与赞赏、特定功能的评价、使用体验及与其他产品的比较等,整体氛围褒贬不一。]

 ·  · 
模型与技术 性能对比

TinyR1 - 32B预览版(超越官方R1蒸馏32B性能)

[关于TinyR1 - 32B - Preview这个模型,讨论涵盖了其训练情况、性能表现、存在的问题、奇虎360的声誉,以及运行模型的相关硬件和费用等,既有积极的期待也有消极的评价]

 ·  · 
模型与技术 训练与微调技术

教程:使用Llama 3.1 (8B) + Unsloth + GRPO训练自己的推理模型

[这是一个关于使用Llama 3.1 (8B)+Unsloth+GRPO训练推理模型的教程帖子,评论围绕模型训练相关的奖励函数、硬件使用、操作疑问、对内容的认可或质疑等展开,整体氛围较为积极且充满探索性]

 ·  ·