性能对比 | LLM Info

R1在图论问题解答中的惊艳表现

[原帖讲述R1在图论问题上表现优于4o，引发众多讨论，包括R1的能力、与其他模型比较、性价比、硬件需求等，观点多样且存在争议]

[原帖感慨从llama2到DeepSeek R1在约1年时间里取得很大进步，评论者们围绕Llama系列版本好坏、DeepSeek R1的性能、开源模型发展、以及一些相关时间和使用场景等问题展开讨论，整体氛围积极且充满探索性]

[帖子围绕DeepSeek - R1 - Distill - Qwen - 1.5B展开讨论，涉及模型性能、ONNX相关、与Claude 3.5比较等多个话题，有对其性能的质疑、肯定，也有对相关技术的讨论，整体氛围比较积极活跃。]

[原帖计算R1与o1的有效成本引发讨论，有人质疑原帖假设与计算方式，还有人提出不同计算结果，也有对比较方式及模型发展等的看法]

[原帖分享Deepseek R1在生物数据分析等方面比Claude Sonnet 3.5好的个人体验，评论者们从不同角度讨论Deepseek R1的性能、使用体验、功能等，既有正面评价也有负面评价，还涉及各种疑问和比较]

[围绕DeepSeek - R1等人工智能模型展开多方面讨论，包括模型性能对比、价格、训练方式、在不同任务中的表现等，同时也存在诸多疑惑与质疑，整体氛围热烈且多元]

[帖子对比Deepseek R1和o1的token输出价格引发讨论，涉及OpenAI的成本、盈利、定价是否贪婪，以及Deepseek R1的性能、获取方式、与其他模型关系等内容，讨论氛围较为理性]

[围绕2024年代码降临节中的模型比较展开讨论，包含对各模型的评价、使用体验、技术疑问等多方面内容，整体氛围积极且充满探索性]

[围绕DeepSeek新R1在编码方面优于sonnet 3.5且在livebench上获得第二名展开讨论，涉及模型性能、版本、使用情况、评分等多个方面，整体氛围比较积极且充满探索性]

[围绕Deepseek R1在Livebench上优于o1 - preview展开讨论，涉及与其他产品比较、编码能力、服务条款问题、正面体验等，整体氛围积极且充满探讨性]