使用o1和DeepSeek一段时间后,ChatGPT 4o显得很愚蠢
[原帖作者认为ChatGPT 4o变蠢,评论者从不同角度探讨其性能下降原因、与其他模型对比情况、企业可能的操作以及表达各自使用体验和对不同模型的看法等,整体氛围是讨论热烈且观点多元]
[原帖作者认为ChatGPT 4o变蠢,评论者从不同角度探讨其性能下降原因、与其他模型对比情况、企业可能的操作以及表达各自使用体验和对不同模型的看法等,整体氛围是讨论热烈且观点多元]
[围绕DeepScaleR - 1.5B - Preview模型使用RL进一步训练展开讨论,涉及模型性能、体验、训练方法、存在问题等多方面内容,整体氛围积极且充满探索性]
[原帖作者创建并开源一个可应用于大型语言模型的架构,评论围绕该架构的GUI是否是广告、相关推荐、架构构成、运行模式、应用价值等方面展开,整体氛围积极且充满探索性]
[该讨论围绕Android NPU使用llama 8B处理约16k个标记展开,涉及技术性能、不同芯片、处理速度、应用情况等多方面内容,氛围较为理性且充满好奇]
[KTransformers团队宣布支持DeepSeek - R1/V3相关成果引发讨论,涵盖性能、硬件、优化等多方面的疑问、观点与分享,整体氛围积极且充满探索性]
[围绕新论文中模型在潜在空间思考的研究,大家表达了认可、期待、疑惑、担忧等不同看法,整体氛围积极但也存在争议]
[围绕Zyphra推出的Zonos新TTS模型展开讨论,涉及模型评价、技术操作、功能比较、许可查询等多方面内容,整体氛围积极且充满探索性]
[Zonos - v0.1 beta发布,大家从性能、技术、应用场景等多方面进行讨论,有认可也指出了不少问题,整体氛围比较理性务实]
[帖子关于DeepSeek R1和o3 - mini在Confabulations Benchmark的比较,评论涵盖图表问题、模型特性、评估基准、对测试的态度等多方面内容,整体氛围比较多元且富有探讨性]
[关于Glyphstral - 24B v1发布的帖子,讨论包括模型名误拼的调侃、对项目的期待、量化版本相关、智力与语言关系、协议选择等多方面内容,氛围较为积极且充满探索性]