模型与技术 微调与性能

Mistral Nemo 在 128K 的秘密:使用基础模型

讨论围绕在长上下文环境中使用基础模型与指令模型的优劣,涉及模型性能、量化方法、采样参数等技术细节。

 ·  ·