模型与技术 性能对比

DeepSeek R1在创意写作排名中居首

[关于deepseek r1在创意写作排名居首,评论者们围绕模型表现、基准测试准确性、排名合理性等展开讨论,氛围多为质疑和探讨]

 ·  · 
模型与技术 新模型发布

新模型与GPT2模型大小相同,令人惊叹

[原帖提及某模型与旧gpt2模型相同大小引发讨论,评论主要围绕R1模型、基准测试、不同模型比较、运行疑问等展开,讨论氛围理性且多为探讨性]

 ·  · 
模型与技术 技术讨论

上周末优化DeepSeek V2/V3 llama.cpp实现 - PR #11446

[原帖作者优化DeepSeek V2/V3 llama.cpp实现,大家围绕PR未合并需重新转换模型、性能影响、DDR5相关参数、Epyc性能等展开讨论,整体氛围积极且充满技术探讨]

 ·  · 
模型与技术 新模型发布

Qwen2.5 - VL发布

[Qwen2.5 - VL发布引发讨论,涵盖模型类型、性能对比、本地使用等方面,整体氛围较为平静专注]

 ·  · 
模型与技术 新模型发布

Janus - Pro - 7B首次测试

[围绕Janus - Pro - 7B首次测试展开讨论,有对测试结果的差评、好评,也有对模型性质的探讨和与其他模型的比较]

 ·  · 
模型与技术 新模型发布

DeepSeek发布新多模态理解与视觉生成模型Janus - Pro 7B

[DeepSeek发布新模型Janus - Pro 7B引发多种讨论,包括模型运行、与其他项目关系,还涉及地缘政治相关争议等内容,整体氛围较复杂。]

 ·  · 
模型与技术 性能对比

R1与其提炼物间稳健性对比的好方法:除法精度

[该帖子围绕R1及其蒸馏模型在除法精度上的稳健性比较展开讨论,包含对比较方式、合成数据、模型性能等多方面的观点探讨,讨论热度有高有低,存在不同观点的交锋]

 ·  · 
模型与技术 性能对比

O1、R1与Sonnet 3.5编码能力对比

[在编码方面,大家分享了O1、R1、Sonnet的使用经验,比较了它们的性能、成本等方面的差异,还涉及到一些模型相关成果,整体氛围比较理性地交流]

 ·  · 
模型与技术 新模型发布

Qwen2.5 - 1M在HuggingFace发布:支持百万标记上下文长度

[Qwen2.5 - 1M发布后,网友围绕其性能、显存需求、在不同硬件上的表现、实用性等多方面展开讨论,整体氛围积极且充满技术探讨氛围]

 ·  · 
模型与技术 性能对比

阿里巴巴MNN团队开源多模态安卓无网络应用

[阿里巴巴开源多模态安卓应用引发讨论,涉及应用性能、功能、发布、安全性等方面,既有惊叹与期待,也有疑惑与质疑]

 ·  ·