模型与技术 量化

更大的量化是否会使RP使用中的句子变得更糟,或者在可以观察到差异的地方?

讨论集中在量化对语言模型在角色扮演应用中生成句子质量的影响,涉及模型理解复杂对话、词汇选择、概念区分能力等多个方面。

 ·  · 
模型与技术 量化

为什么Q4似乎始终能超越包括Q8在内的所有其他量化?

讨论围绕Q4模型在量化模型中的表现优于其他模型展开,涉及统计显著性、模型参数差异、测试方法等多个方面,存在争议和不同观点。

 ·  · 
模型与技术 量化

Llama 3.1 405B EXL2量化结果

讨论围绕Llama 3.1 405B EXL2量化模型的性能,特别是在长上下文任务中的表现,以及与70B模型的比较,显示出405B模型在这些任务中的优势。

 ·  · 
模型与技术 量化

量化可视化指南

讨论围绕量化技术的视觉指南展开,涉及量化方法的比较、技术细节和应用场景,总体氛围积极且具有教育意义。

 ·  · 
模型与技术 量化

有人想测试我在Ollama中启用量化K/V缓存的PR吗?

讨论围绕在Ollama中启用量化K/V缓存的拉取请求,重点关注内存使用和GPU层数的测量问题。

 ·  ·