大家好，

我是检索增强生成（RAG）领域的新手，面对网上的海量信息感到非常不知所措。我阅读了很多文章和帖子，但很难弄清楚什么是最新且实用的设置，无论是本地环境还是在线服务。

我希望你们中的一些人能提供一个完整的指南或分解，介绍目前最佳的设置。特别是，我希望能得到以下方面的指导：

嵌入：目前有哪些最佳的免费和付费选项？
向量存储：哪些在本地和在线环境中表现最佳？此外，它们在易用性和性能方面如何比较？
RAG框架：是否有任何维护良好且推荐的框架或库？
其他工具：还有哪些工具或技巧可以使RAG设置更高效或更易于管理？

任何帮助或建议都将非常感激！我很想听听你们使用的设置以及哪些对你们最有效。

提前感谢！

讨论总结

本次讨论主要围绕Retrieval-Augmented Generation (RAG)的最佳实践展开，涵盖了嵌入技术、向量存储、框架选择等多个方面。新手用户在寻求最佳设置的指导，而资深用户则分享了他们的经验和推荐工具。讨论中涉及了多种工具和框架，如Langchain、ColPali、Qwen2-VL、pgvector等，以及一些具体的GitHub仓库和项目。整体氛围较为积极，用户们分享了各自的见解和经验，帮助新手更好地理解和应用RAG技术。

主要观点

👍 RAG设置的选择应根据数据、问题和答案的期望来决定
- 支持理由：不同的应用场景需要不同的RAG设置，灵活性是关键。
- 反对声音：无明显反对声音，多数用户认同这一观点。
🔥 使用视觉语言模型（Vision LLM）处理文档是当前RAG的最佳实践
- 正方观点：Merve在Hugging Face上的帖子提供了详细的实现指南，推荐使用ColPali和Qwen2-VL。
- 反方观点：无明显反方观点，多数用户认同这一实践。
💡 推荐使用embedchain.ai的方法
- 解释：该方法高效且低代码，适合新手或希望简化流程的用户。
💡 pgvector是当前RAG设置的最佳选择
- 解释：用户推荐pgvector作为解决方案，并询问了其他用户的使用经验和生产环境中的运行情况。
💡 新手用户寻求主要信息来源
- 解释：新手用户询问其他用户通常从哪些来源获取信息，表明自己也是新手。

金句与有趣评论

“😂 ekaj：The tl/dr is that it depends on your data, the questions being asked and the expectations for the answers.”
- 亮点：简洁明了地总结了RAG设置的关键因素。
“🤔 No_Palpitation7740：According to Merve from HF the best way is to use vision LLM on your documents.”
- 亮点：引用了权威来源，提供了具体的最佳实践。
“👀 hawkedmd：Try the efficient and low code embedchain.ai approach!”
- 亮点：直接提供了具体的解决方案，简洁高效。
“👀 RedditDiedLongAgo：pgvector is all you need.”
- 亮点：自信地推荐了一个具体的工具，简洁有力。
“👀 dummy-Ai：what sources do you get your primary information from? im new too”
- 亮点：直接提出了新手用户关心的问题，简洁明了。

情感分析

讨论的总体情感倾向较为积极，用户们分享了各自的见解和经验，帮助新手更好地理解和应用RAG技术。主要分歧点在于具体的工具和框架选择，但整体上用户们倾向于分享和推荐，没有明显的负面情绪或争议。

趋势与预测

新兴话题：多模态RAG和视觉语言模型的应用可能会引发后续讨论。
潜在影响：随着RAG技术的不断发展，更多高效且低代码的工具和框架可能会涌现，进一步推动该领域的应用和普及。

详细内容：

《探索检索增强生成（RAG）的最佳设置引发热议》

在 Reddit 上，一则关于“什么是检索增强生成（RAG）的最佳当前设置？需要有关嵌入、向量存储等方面的帮助”的帖子引起了广泛关注。该帖子获得了众多回复和较高的热度。

原帖作者表示自己初涉 RAG 领域，面对海量信息感到困惑，希望大家能提供包括嵌入、向量存储、RAG 框架和其他工具等方面的最新实用设置指南。

这场讨论的焦点集中在多个方面。有人提到了一些旧的 RAG 笔记链接，如 https://github.com/rmusser01/tldw/blob/main/Docs/RAG_Notes.md ，并指出可查看 https://github.com/rmusser01/tldw/milestone/14 跟踪自己项目中 RAG 的改进情况，认为其取决于数据、问题和对答案的期望。有人称根据 Merve 的观点，使用文档上的视觉 LLM 是最佳方式，并提供了相关链接 https://x.com/mervenoyann/status/1831737088468791711?t=HJ4MGjJjEykfOoNYkeoAWg&s=19 。有人推荐尝试高效且低代码的 embedchain.ai 方法。还有人提到使用 Docling 解析 pdf 为 markdown，然后选择 Anythingllm 或 kotaemon 来一站式解决 RAG 问题，也有人使用 ooba booga 来通过 api 托管 qwen 。有人认为 https://github.com/neuml/txtai 对自己有效。有人说 pgvector 就足够了，还有人提到 pgvector + pgvectorscale 。有人提出是否擅长编写 Python 程序以及选择免费本地程序还是付费在线服务会影响答案。有人在实验离线的 Raptor-RAG 分叉，认为其是最先进的，并提供了官方 repo 链接 https://github.com/parthsarthi03/raptor 。有人认为 https://github.com/NirDiamant/RAG_Techniques 或许是最好的 RAG 仓库。有人在框架选择上纠结于 DSPY、Langroid 或 Llmware，在向量存储上倾向于开发/概念验证使用 DuckDB，生产使用 Postgres ，或许使用 llamaindex 服务。还有人推荐 Langroid ，称其在 DocChatAgent 中有透明、具指导性和灵活的 RAG 实现。

在这场讨论中，大家各抒己见，但也形成了一些共识，那就是 RAG 的最佳设置没有绝对标准，需要根据具体需求和情况来选择。特别有见地的观点是强调了要结合自身的技术水平、项目需求和可用资源来确定最佳设置。

总的来说，这场关于 RAG 最佳设置的讨论展现了其复杂性和多样性，为初涉该领域的人们提供了丰富的参考和思考方向。

讨论总结#

主要观点#

金句与有趣评论#

情感分析#

趋势与预测#

详细内容：#