原贴链接

尝试由https://github.com/HimariO所做的Qwen2.5 - VL的gguf转换!更多信息可查看:https://github.com/ggml - org/llama.cpp/issues/11483#issuecomment - 2727577078。我们转换了3B微调的SpaceQwen2.5 - VL:https://huggingface.co/remyxai/SpaceQwen2.5 - VL - 3B - Instruct/blob/main/SpaceQwen2.5 - VL - 3B - Instruct - F16.gguf。现在你可以在CPU或GPU上运行更快更好的模型,以提高具身人工智能/机器人应用中的空间推理能力。

讨论总结

原帖主要推广GGUF for Qwen2.5 - VL,评论涉及多个方面。包括对gguf和awq优劣性的比较、为ovis2寻求llama.cpp支持、模型之间的性能对比、在机器人上运行的操作建议以及基于此的机器人项目计划等,大家积极分享观点和经验,氛围较为积极探索🧐

主要观点

  1. 👍 认为ovis2的34b模型比qwen2.5vl 70b有优势
    • 支持理由:在自己的测试中ovis2的16b模型能看到qwen 72b看不到的东西
    • 反对声音:无
  2. 🔥 对gguf和awq的优劣性存在疑问
    • 正方观点:无(只是提问)
    • 反方观点:无(只是提问)
  3. 💡 提出在机器人上运行的操作建议(更新.yaml后用llama_ros运行)
    • 解释:为原帖内容补充了在机器人上运行相关内容的一种方式

金句与有趣评论

  1. “😂 Do you know this guy? If so maybe ask him if he could do the ovis2 support for llama.cpp, its even better than qwen2.5vl 70b with the 34b model as far as I know but it has no gguf and llama.cpp support /:”
    • 亮点:提出为ovis2寻求支持并比较了ovis2和qwen2.5vl的性能
  2. “🤔 Im my tests even the 16b model was able to see stuff that the 72b qwen wasnt able to see, like text but also other stuff and its phenomenal for stuff like websites with a lot of clutter”
    • 亮点:具体阐述ovis2在某些方面比qwen表现更好的测试结果
  3. “👀 Try running on your robot with llama_ros after updating the.yaml”
    • 亮点:给出在机器人上运行相关内容的操作建议

情感分析

总体情感倾向积极,大家在分享观点和经验时都比较正面。主要分歧点在于不同模型性能的比较,可能是因为各自的使用场景和测试条件不同。

趋势与预测

  • 新兴话题:基于GGUF for Qwen2.5 - VL构建机器人项目。
  • 潜在影响:可能会推动相关模型在机器人领域的应用和探索。

详细内容:

标题:探索 Qwen2.5-VL 的 GGUF 转换

最近,Reddit 上有一篇关于 Qwen2.5-VL 的 GGUF 转换的帖子引发了众多关注。该帖子获得了大量的点赞和众多评论。

原帖主要介绍了由https://github.com/HimariO 制作的 Qwen2.5-VL 的 GGUF 转换,并提供了多个相关链接,包括https://github.com/ggml-org/llama.cpp/issues/11483#issuecomment-2727577078等,还提到了对 3B 精细调整的 SpaceQwen2.5-VL 的转换成果。

帖子引发的讨论方向众多,核心问题包括 GGUF 与其他模型的比较,如有人问道:“GGUF 或 AWQ 哪一个更好?” 也有人在探讨不同模型在实际应用中的表现和效果。

在讨论焦点与观点分析方面,有人表示喜欢 AWQ 背后的工作,认为麻省理工学院的 Han 实验室很棒,但也有人钟情于 GGUF 简便的封装方式,并提供了相关链接https://github.com/remyxai/FFMPerative。有人推荐 ovis2 模型,并表示其在某些方面表现出色,而原帖作者表示愿意尝试。有人分享了自己在测试不同模型时的经历,比如 16b 模型能看到 72b 的 qwen 看不到的东西。还有人希望利用相关模型构建简单的机器人项目,原帖作者也分享了相关的项目经验和链接。

总之,这场讨论展示了大家对模型的深入探索和对技术应用的热情,不同的观点和经验交流丰富了对这些模型的认识和理解。