模型与技术

DeepSeek R1在创意写作排名中居首

[关于deepseek r1在创意写作排名居首，评论者们围绕模型表现、基准测试准确性、排名合理性等展开讨论，氛围多为质疑和探讨]

[原帖提及某模型与旧gpt2模型相同大小引发讨论，评论主要围绕R1模型、基准测试、不同模型比较、运行疑问等展开，讨论氛围理性且多为探讨性]

[原帖作者优化DeepSeek V2/V3 llama.cpp实现，大家围绕PR未合并需重新转换模型、性能影响、DDR5相关参数、Epyc性能等展开讨论，整体氛围积极且充满技术探讨]

[Qwen2.5 - VL发布引发讨论，涵盖模型类型、性能对比、本地使用等方面，整体氛围较为平静专注]

[围绕Janus - Pro - 7B首次测试展开讨论，有对测试结果的差评、好评，也有对模型性质的探讨和与其他模型的比较]

[DeepSeek发布新模型Janus - Pro 7B引发多种讨论，包括模型运行、与其他项目关系，还涉及地缘政治相关争议等内容，整体氛围较复杂。]

[该帖子围绕R1及其蒸馏模型在除法精度上的稳健性比较展开讨论，包含对比较方式、合成数据、模型性能等多方面的观点探讨，讨论热度有高有低，存在不同观点的交锋]

[在编码方面，大家分享了O1、R1、Sonnet的使用经验，比较了它们的性能、成本等方面的差异，还涉及到一些模型相关成果，整体氛围比较理性地交流]

[Qwen2.5 - 1M发布后，网友围绕其性能、显存需求、在不同硬件上的表现、实用性等多方面展开讨论，整体氛围积极且充满技术探讨氛围]

[阿里巴巴开源多模态安卓应用引发讨论，涉及应用性能、功能、发布、安全性等方面，既有惊叹与期待，也有疑惑与质疑]