模型与技术 性能对比

深度探索新基准分数

[围绕新DeepSeek基准分数展开多方面讨论,包括与其他产品对比、性能、版本命名等,还涉及到东西方科技发展及竞争相关话题,整体氛围热烈且多元]

 ·  · 
模型与技术 性能对比

DeepSeek V3-0324在代码创意基准测试中追平Sonnet 3.7

[原帖通过代码创意基准测试对比DeepSeek V3 - 0324和Sonnet3.7,评论围绕模型表现、程序大小、测试结果等展开,有观点分享、疑问提出和对不同模型特性的讨论,整体氛围积极探索]

 ·  · 
模型与技术 性能对比

深度探索v3与R1对比(首为v3)

[围绕New deepseek v3和R1展开讨论,包含模型比较、运行情况、性能、价格等多方面内容,有调侃幽默也有质疑期待,氛围较活跃多元]

 ·  · 
模型与技术 性能对比

Claude的"think"工具将准确率提升54%(含与Ollama集成)

[帖子介绍Claude的“think”工具提升准确性,评论围绕工具的创新性、作用机制、是否有效等展开讨论,有质疑也有赞同]

 ·  · 
模型与技术 性能对比

Qwq因使用不当而差评

[围绕Qwq被差评是因为使用错误这一观点展开讨论,涉及Qwq在不同场景下的表现、与其他模型对比、模型参数设置、运行问题等多方面内容,讨论氛围较理性且多元]

 ·  · 
模型与技术 性能对比

Q2模型毫无用处,Q4是不破坏模型(至少对MLX而言)的最低量化水平,Mistral Small 24B在Q2下的示例

[该讨论围绕模型量化展开,涉及不同量化水平(如Q2、Q4等)对模型性能的影响,有观点赞同原帖关于Q2无用、Q4为最低可用量化水平(至少对MLX而言)的说法,也有反对声音认为不应下绝对结论,还涉及不同模型在量化中的表现差异等内容,讨论氛围较为理性和专业]

 ·  · 
模型与技术 性能对比

Mistral 24b初体验:表现出色且速度快

[围绕Mistral 24b展开讨论,包括其性能、在翻译方面的表现、与其他模型对比,大家对它总体比较喜爱,同时也涉及硬件相关话题]

 ·  · 
硬件与部署 性能对比

AMD Strix Halo迷你PC运行70B Q8模型视频发布

[关于运行70B Q8模型的Mini PC,大家从性能、硬件、运行速度等多方面进行讨论,整体氛围比较理性且有技术探讨性]

 ·  · 
模型与技术 性能对比

量化方法很重要:MLX Q2与GGUF Q2_K对比,MLX破坏模型性能而GGUF保持可用

[原帖对比MLX Q2和GGUF Q2_K量化方法对模型性能的影响,评论围绕量化方法、模型性能等多方面展开,有讨论、疑问、建议,整体氛围较为理性]

 ·  · 
硬件与部署 性能对比

A770与9070XT基准测试

[原帖进行A770与9070XT的基准测试,评论围绕测试的后端、不同系统下的性能、各硬件的优化建议、对测试结果的质疑等方面展开,整体氛围以技术交流为主。]

 ·  ·