新模型发布

TinyR1 - 32B - 预览：超级蒸馏以仅5%的参数量实现接近R1的性能

[关于TinyR1 - 32B - Preview的讨论，包含对模型的不信任、质疑其是否为骗局，还有人提到Qihoo360声誉不佳，同时也涉及到一些模型相关的技术观点和体验等内容，整体氛围充满争议。]

[原帖作者分享仅用20美元训练出一个法语推理模型，评论者围绕模型的训练细节、成本、性能、使用案例等提问、表示赞同或质疑，同时还夹杂着幽默的互动和与法国文化相关的调侃]

[这是关于Sesame实时对话音频模型的讨论，大家普遍对演示效果表示惊叹，期待模型开源或发布权重，同时也指出了模型存在的一些问题。]

[关于同一天发布的两个扩散LLMs展开讨论，有消极看法如否定其可用性，也有积极期待其促进创新，还涉及到模型性能比较、试用体验等多方面内容]

[帖子介绍LLaDA - 大型语言扩散模型相关资源，评论围绕模型特点、性能、与人类大脑思维方式类比、存在的问题及应用前景等展开讨论，整体氛围积极且充满探索性]

[围绕Phi模型家族展开讨论，涉及Phi - 4系列模型的性能、规模、功能支持等方面，还有小型语言模型的使用效果等话题，整体氛围较为理性讨论且有部分争议]

[围绕Kokoro TTS 1.1展开讨论，涉及版本特性、语言支持、与其他TTS比较、功能期待与不满等方面，整体氛围是对Kokoro TTS 1.1的多方面探讨]

[关于Phi - 4 mini的讨论，包括与其他模型对比、性能表现、适用场景等方面，大家观点不一，有好奇、期待，也有不满和疑惑，氛围比较多元。]

[微软宣布Phi - 4 - multimodal和Phi - 4 - mini引发众多讨论，涵盖模型性能、参数、多语言支持、应用场景等多方面，有正面评价也有质疑，大家对其充满期待同时也有诸多疑问。]

[围绕DeepGEMM库展开多方面讨论，包括技术特性、对不同硬件的支持、与其他技术的关系、成本质疑等，情感倾向多样，既有期待支持也有质疑批判]