模型与技术

使用o1和DeepSeek一段时间后，ChatGPT 4o显得很愚蠢

[原帖作者认为ChatGPT 4o变蠢，评论者从不同角度探讨其性能下降原因、与其他模型对比情况、企业可能的操作以及表达各自使用体验和对不同模型的看法等，整体氛围是讨论热烈且观点多元]

[围绕DeepScaleR - 1.5B - Preview模型使用RL进一步训练展开讨论，涉及模型性能、体验、训练方法、存在问题等多方面内容，整体氛围积极且充满探索性]

[原帖作者创建并开源一个可应用于大型语言模型的架构，评论围绕该架构的GUI是否是广告、相关推荐、架构构成、运行模式、应用价值等方面展开，整体氛围积极且充满探索性]

[该讨论围绕Android NPU使用llama 8B处理约16k个标记展开，涉及技术性能、不同芯片、处理速度、应用情况等多方面内容，氛围较为理性且充满好奇]

[KTransformers团队宣布支持DeepSeek - R1/V3相关成果引发讨论，涵盖性能、硬件、优化等多方面的疑问、观点与分享，整体氛围积极且充满探索性]

[围绕新论文中模型在潜在空间思考的研究，大家表达了认可、期待、疑惑、担忧等不同看法，整体氛围积极但也存在争议]

[围绕Zyphra推出的Zonos新TTS模型展开讨论，涉及模型评价、技术操作、功能比较、许可查询等多方面内容，整体氛围积极且充满探索性]

[Zonos - v0.1 beta发布，大家从性能、技术、应用场景等多方面进行讨论，有认可也指出了不少问题，整体氛围比较理性务实]

[帖子关于DeepSeek R1和o3 - mini在Confabulations Benchmark的比较，评论涵盖图表问题、模型特性、评估基准、对测试的态度等多方面内容，整体氛围比较多元且富有探讨性]

[关于Glyphstral - 24B v1发布的帖子，讨论包括模型名误拼的调侃、对项目的期待、量化版本相关、智力与语言关系、协议选择等多方面内容，氛围较为积极且充满探索性]