模型与技术 性能对比

与70B模型还是70个1B模型战斗

[在讨论是选择与70B模型还是70个1B模型战斗(1B模型能互相推理)的问题中,大家从不同角度分析,有选择倾向、战斗场景、模型特性等方面的讨论,整体氛围轻松且充满创意]

 ·  · 
模型与技术 性能对比

Qwen QwQ在辅助编码基准测试中表现平平

[关于Qwen QwQ在aider编码基准测试结果不佳的帖子引发了诸多讨论,包括模型在不同任务中的表现、存在的问题、运行环境、工作流程等方面,大家观点各异且有对后续改进方向的探讨]

 ·  · 
模型与技术 性能对比

QwQ 32b在Simple bench上的测试

[围绕QwQ 32b的测试结果展开讨论,包括对结果的不同评价、推理过程相关以及对其作为alpha模型的看法等,整体氛围较为积极且充满探索性]

 ·  · 
模型与技术 性能对比

当前最喜爱的模型

[原帖询问最喜欢的模型,评论者们分享了各自喜欢的模型,包括使用场景、性能、优缺点等,整体氛围积极,大家交流不同模型的使用体验]

 ·  · 
模型与技术 性能对比

ONNX为何在大语言模型领域未能成功

[讨论ONNX在LLM世界未成功的原因,包括技术局限、使用体验差、与其他技术对比的劣势等,总体氛围比较理性地分析问题]

 ·  · 
模型与技术 性能对比

开源才是正途

[原帖对不同人工智能进行推理问题测试并分享结果,评论围绕这些结果展开,有对开源模型的看好、对特定模型的期待、对推理问题的好奇等,整体氛围积极且充满探索性]

 ·  · 
模型与技术 性能对比

Qwq回答冗长且无重点

[原帖讨论向qwq提问编码/数学问题时回答冗长且无意义,评论者们提出了这是必要过程、有解决办法、存在替代方案、是实验性模型会改进等观点]

 ·  · 
模型与技术 性能对比

AMD GPU与Llama cpp组合时性能显著降低,求原因

[原帖讲述AMD GPU与Llama cpp结合性能显著下降寻求帮助,评论给出了多种解决建议但测试结果不佳,整体氛围专注于技术探讨]

 ·  · 
模型与技术 性能对比

QwQ与o1等的对比示例

[该讨论围绕QwQ与其他模型相关话题展开,包括测试结果、性能表现、技术发展等方面,整体氛围积极且充满技术探讨的氛围]

 ·  · 
模型与技术 性能对比

Nemotron 70b与Qwen2.5 72b性能对比

[原帖比较了Nemotron 70b和Qwen2.5 72b的性能,引发了关于模型比较、测试结果、测试条件以及对模型特性看法等多方面的讨论,讨论氛围既有理性探讨也有质疑。]

 ·  ·