模型与技术 性能对比

R1在图论问题解答中的惊艳表现

[原帖讲述R1在图论问题上表现优于4o,引发众多讨论,包括R1的能力、与其他模型比较、性价比、硬件需求等,观点多样且存在争议]

 ·  · 
模型与技术 性能对比

从Llama2到DeepSeek R1:一年内的巨大进步

[原帖感慨从llama2到DeepSeek R1在约1年时间里取得很大进步,评论者们围绕Llama系列版本好坏、DeepSeek R1的性能、开源模型发展、以及一些相关时间和使用场景等问题展开讨论,整体氛围积极且充满探索性]

 ·  · 
模型与技术 性能对比

DeepSeek - R1 - Distill - Qwen - 1.5B本地浏览器WebGPU上100%运行,数学基准测试性能超GPT - 4o和Claude - 3.5 - Sonnet

[帖子围绕DeepSeek - R1 - Distill - Qwen - 1.5B展开讨论,涉及模型性能、ONNX相关、与Claude 3.5比较等多个话题,有对其性能的质疑、肯定,也有对相关技术的讨论,整体氛围比较积极活跃。]

 ·  · 
模型与技术 性能对比

R1与o1有效成本计算及结果

[原帖计算R1与o1的有效成本引发讨论,有人质疑原帖假设与计算方式,还有人提出不同计算结果,也有对比较方式及模型发展等的看法]

 ·  · 
模型与技术 性能对比

Deepseek R1使用体验:优于Claude Sonnet 3.5

[原帖分享Deepseek R1在生物数据分析等方面比Claude Sonnet 3.5好的个人体验,评论者们从不同角度讨论Deepseek R1的性能、使用体验、功能等,既有正面评价也有负面评价,还涉及各种疑问和比较]

 ·  · 
模型与技术 性能对比

深擎R1及其蒸馏基准测试的彩色标注

[围绕DeepSeek - R1等人工智能模型展开多方面讨论,包括模型性能对比、价格、训练方式、在不同任务中的表现等,同时也存在诸多疑惑与质疑,整体氛围热烈且多元]

 ·  · 
模型与技术 性能对比

Deepseek R1输出每百万token仅2.19美元,对比o1的60美元

[帖子对比Deepseek R1和o1的token输出价格引发讨论,涉及OpenAI的成本、盈利、定价是否贪婪,以及Deepseek R1的性能、获取方式、与其他模型关系等内容,讨论氛围较为理性]

 ·  · 
模型与技术 性能对比

2024代码降临节中的模型对比

[围绕2024年代码降临节中的模型比较展开讨论,包含对各模型的评价、使用体验、技术疑问等多方面内容,整体氛围积极且充满探索性]

 ·  · 
模型与技术 性能对比

DeepSeek新R1在实时评测中排第二,推理加持下编码优于Sonnet 3.5

[围绕DeepSeek新R1在编码方面优于sonnet 3.5且在livebench上获得第二名展开讨论,涉及模型性能、版本、使用情况、评分等多个方面,整体氛围比较积极且充满探索性]

 ·  · 
模型与技术 性能对比

Deepseek R1在Livebench上总体优于o1 - preview

[围绕Deepseek R1在Livebench上优于o1 - preview展开讨论,涉及与其他产品比较、编码能力、服务条款问题、正面体验等,整体氛围积极且充满探讨性]

 ·  ·