从哪个提供商可以获取最纯净版本的Llama3.1 405B？多模态版本（能读取图像）何时推出？

我主要使用together.ai来获取开源模型，但上面的Llama3.1 405B显示为Meta-Llama-3.1-405B-Instruct-Turbo，我不确定Turbo是否意味着它是量化或稀释过的。有人知道哪里可以使用最佳版本吗？

另外，多模态版本的Llama3.1 405B（能够读取图像）何时推出？

本次讨论主要聚焦于Llama3.1 405B模型的Turbo版本是否为量化版本及其对性能的影响。评论者普遍认为Turbo版本是经过量化的，主要因为硬件限制和成本考虑。此外，讨论中还涉及了未来多模态版本（能读取图像）的发布时间，但目前尚无明确信息。

“😂 Everyone is running Turbo (the FP8) because 8x80GB is not enough to fit FP16.”
- 亮点：反映了硬件限制对模型选择的影响。
“🤔 Turbo does indeed mean it is quantized, but that’s just the status quo for 405B hosting right now.”
- 亮点：说明了量化版本的普遍性及其原因。
“👀 turbo is most likely the 8bit that meta released.”
- 亮点：对Turbo版本的推测，增加了讨论的深度。

讨论的总体情感倾向较为中性，主要关注技术细节和硬件限制。主要分歧点在于量化版本对模型性能的影响，以及未来多模态版本的发布时间。