硬件与部署 性能对比

AMD新驱动使koboldcpp性能提升达11%

[原帖介绍AMD新驱动在koboldcpp中的性能提升,评论包含对原帖拼写错误的纠正、对性能提升的赞同、对AMD驱动的观望态度、显卡选择与AI模型运行相关讨论等内容,总体氛围较为积极平和。]

 ·  · 
模型与技术 性能对比

14B及以下模型有何用途?能做哪些酷事?

[原帖询问14B及以下模型是否有用,评论者们从不同角度阐述观点,包括模型在不同任务中的表现、与其他模型的比较、在特定场景下的可用性等,整体氛围积极且充满建设性]

 ·  · 
硬件与部署 性能对比

苹果M3 Ultra GPU性能之谜

[关于苹果M3 Ultra的GPU性能,原帖进行了一些分析探讨,评论者从计算合理性、数据准确性、性价比等多方面提出质疑、纠错和不同观点,整体氛围较理性且讨论方向多样]

 ·  · 
模型与技术 性能对比

使用QwQ和Aider数小时后的想法

[原帖对QwQ和Aider进行评测,评论者们围绕QwQ模型的性能、与其他模型比较、使用体验等展开讨论,整体氛围比较理性且讨论内容多为技术向。]

 ·  · 
模型与技术 性能对比

演绎推理Qwen - 32B超越部分模型

[围绕Deductive - Reasoning - Qwen - 32B展开讨论,包括模型的训练情况、性能表现、推广性、实用性等方面,同时有对模型的感谢、质疑等不同态度的表达]

 ·  · 
模型与技术 性能对比

QwQ在数学方面超越深度搜索模型

[原帖声称QwQ模型在数学方面表现优秀,评论者围绕QwQ模型在不同方面的表现、与其他模型对比、测试的合理性等展开讨论,氛围理性且多元]

 ·  · 
模型与技术 性能对比

QwQ - 32B在误导性注意力基准测试中接近DeepSeek - R1,但存在死循环问题

[原帖讨论QwQ - 32B模型在Misguided Attention Benchmark中的表现及存在的无限循环问题,评论围绕模型配置、可能的解决办法、与其他模型的比较以及相关疑惑展开]

 ·  · 
模型与技术 性能对比

QwQ - 32B解决o1 - preview密码问题

[QwQ - 32B解决了Cipher问题,但存在运行耗时久、可能的数据集污染等问题,大家还对Q4KM是否足够、不同模型性能对比等展开讨论,整体氛围比较理性探讨]

 ·  · 
模型与技术 性能对比

基于Mistral - Small - 24B - Instruct - 2501 - writer的模型微调与性能对比

[作者介绍Mistral - Writer模型及其性能,与其他模型比较,评论者围绕模型版本、计算资源、比较不同模型、对故事输出的评价等话题展开讨论]

 ·  · 
模型与技术 性能对比

测试你的API提供商是否量化你的Qwen/QwQ - 32B

[原帖探讨测试API提供者是否量化QwQ - 32B模型,通过迷宫问题测试,评论围绕不同量化版本测试结果、测试可靠性、模型推理能力、免费模型解决迷宫问题情况等展开讨论,整体氛围积极探索]

 ·  ·