模型与技术 性能测试

mistral nemo 128k 针测试

讨论围绕nemo 128k模型在处理长文档时的性能表现,通过needle test发现其性能优于RULER,但仍存在上下文丢失问题。

 ·  ·