模型与技术 模型更新

Llama 3.1 再次更改了其聊天模板...

Reddit用户讨论了Llama 3.1聊天模板的更新,涉及工具调用、元数据编辑和特殊标记错误,以及这些更新对llama.cpp的影响和技术挑战。

 ·  · 
模型与技术 模型更新

Mistral 12B Celeste V1.6 - 最大连贯性,最小混乱!

讨论围绕Mistral 12B Celeste V1.6模型在故事写作、指令跟随、量化等方面的表现和优化展开,涉及模型训练数据、性能改进和用户体验。

 ·  · 
模型与技术 模型更新

llama.cpp: 支持 llama 3.1 rope 缩放因子合并

Reddit用户热烈讨论llama.cpp项目中对llama 3.1 rope scaling factors的支持合并,涉及量化、模型更新和工具调用等多个技术细节。

 ·  · 
模型与技术 模型更新

Llama3.1指令模型仍有新提交 - 修复了工具调用问题

讨论围绕Llama3.1 instruct模型的更新和修复,特别是关于分词器和工具调用的修复,以及模型版本管理和量化问题。

 ·  · 
模型与技术 模型更新

SpaceLlama3.1:专为空间推理设计的VLM

讨论围绕SpaceLlama3.1这一专门用于空间推理的视觉语言模型展开,涉及其性能、应用场景及在特定挑战中的表现。

 ·  ·