原贴链接

一个 RAG 系统涉及多个组件,如数据摄取、检索、重新排序和生成,每个组件都有广泛的选择。例如,在简化的场景中,您可能需要在以下选项之间进行选择:

  • 5 种不同的分块方法
  • 5 种不同的分块大小
  • 5 种不同的嵌入模型
  • 5 种不同的检索器
  • 5 种不同的重新排序/压缩器
  • 5 种不同的提示
  • 5 种不同的 LLM

这导致了 78,125 种独特的 RAG 配置!即使您可以在 5 分钟内评估每个设置,仍然需要 271 天的连续试错。简而言之,手动找到最佳 RAG 配置几乎是不可能的。

这就是我们构建 RAGBuilder 的原因——它对 RAG 参数(如分块大小、嵌入等)进行超参数调整,评估多个配置,并显示一个仪表板,您可以在其中看到性能最佳的 RAG 设置,而且最好的部分是它是开源的!

我们的开源工具 RAGBuilder 现在支持 AzureOpenAI、GoogleVertex、Groq(适用于 Llama 3.1)和 Ollama!🎉

我们还现在支持 Milvus DB(lite + 独立本地)、SingleStore 和 PG Vector(本地)

查看并告诉我们您的想法!

https://github.com/kruxai/ragbuilder

讨论总结

本次讨论主要围绕RAGBuilder工具的功能扩展、支持平台、未来发展以及用户的反馈和建议。用户普遍对RAGBuilder表示肯定,询问是否有发展路线图以及是否欢迎贡献者参与。同时,用户对工具的具体功能如Ollama的支持、链接问题等提出了疑问和建议,开发团队也积极回应并承诺更新和改进。总体上,讨论氛围积极,用户对工具的未来发展表示期待。

主要观点

  1. 👍 RAGBuilder工具被认为是“good shit”
    • 支持理由:用户对其性能和功能持积极评价。
    • 反对声音:无明显反对声音。
  2. 🔥 用户询问是否有详细的发展路线图
    • 正方观点:显示了对工具未来发展的关注。
    • 反方观点:无明显反对声音。
  3. 💡 用户表达了对参与贡献的兴趣
    • 解释:希望了解是否欢迎外部贡献者。
  4. 🌟 用户对Ollama的支持有疑问
    • 解释:认为需要OpenAI API 密钥,但后续澄清不再需要。
  5. 🚀 用户建议增加对Openrouter提供商的支持
    • 解释:希望这一建议能被纳入开发路线图中。

金句与有趣评论

  1. “😂 tmplogic:good shit, do you have a roadmap and are you looking for contributors?”
    • 亮点:简洁直接地表达了用户对工具的积极态度和对未来发展的兴趣。
  2. “🤔 jungle:Seems interesting. I have a question though: you claim to support ollama, but according to the demo and the docs, I’d have to provide an OpenAI API key…?”
    • 亮点:提出了具体的技术疑问,显示了用户对工具的深入关注。
  3. “👀 tgredditfc:Can’t wait! Let us know! Keep up the good job:)”
    • 亮点:表达了用户对工具未来发展的期待和鼓励。

情感分析

讨论的总体情感倾向积极,用户对RAGBuilder工具的功能和未来发展表示肯定和期待。主要分歧点在于对具体功能如Ollama的支持和链接问题的疑问,但开发团队积极回应并承诺改进,增强了用户的信任和期待。

趋势与预测

  • 新兴话题:对Graph RAG的支持和Openrouter提供商的增加可能是未来讨论的新焦点。
  • 潜在影响:RAGBuilder工具的持续改进和功能扩展可能会吸引更多用户参与贡献和使用,进一步推动其在AI领域的应用和发展。

详细内容:

标题:RAGBuilder 新增多项支持,引发热烈讨论

Reddit 上有一则关于 RAGBuilder 的热门帖子引起了大家的关注。这篇帖子介绍说,RAG 系统包含多个组件,每个组件都有多种选择,例如有 5 种不同的分块方法、5 种不同的分块大小、5 种不同的嵌入模型等等,这导致了多达 78125 种独特的 RAG 配置。手动找到最优配置几乎不可能,所以推出了 RAGBuilder 这个开源工具。它能对 RAG 参数进行超参数调整,并展示最优配置。该工具如今新增了对 AzureOpenAI、GoogleVertex、Groq(用于 Llama 3.1)和 Ollama 的支持,还支持了 Milvus DB(lite + 独立本地版)、SingleStore 和 PG Vector(本地版)。此贴获得了众多关注,评论数众多。

帖子引发的主要讨论方向包括:有人称赞这是个很棒的工具,并询问是否有路线图以及是否需要贡献者;有人对声称支持 Ollama 但需要提供 OpenAI API 键提出疑问,开发者回复说演示是旧版本,新版本不再需要,会很快更新演示;有人询问是否支持 Graph RAG,开发者表示还未支持,会在下一版本实现;有人建议添加 Openrouter 提供商,开发者表示会加入路线图;有人提出能否用 LLM 进行分析,开发者回复目前不可能,需要对每个 RAG 配置进行评估并看结果来决定最优配置;还有人提到了关于 Langchain 的讨论。

在这些讨论中,不同观点碰撞。比如有人对工具的新支持功能表示期待,也有人对一些细节提出疑问。像有用户说:“似乎很有趣。我有个问题,你们声称支持 Ollama,可根据演示和文档,我得提供一个 OpenAI API 键……?” 而开发者回应:“演示是旧版本的。不再需要 OpenAI 了。会很快更新演示。” 这些讨论展现了大家对这个工具的关注和思考。

总的来说,大家对 RAGBuilder 的新进展表现出了浓厚的兴趣,同时也在不断提出问题和建议,促进工具的完善和发展。相信随着后续的更新和优化,它会给大家带来更多的惊喜和便利。