原贴链接

我一直在个人项目中使用本地8b网络+RAG。对于我所关心的数据，在回忆/信息方面，它的表现确实比最新的ChatGPT要好得多。为什么没有一家AI服务提供这种方案呢？这似乎不是性能问题，在消费级硬件上把一本书分割成RAG数据库的时间转瞬即逝，而且我都懒得去测量相似性搜索，因为与推理相比它太快了。它非常有用。你可以把手册、百科全书、代码等几乎任何非虚构类书籍放入RAG数据库并得到有出处的答案。与ChatGPT相比，使用ChatGPT时我得a)希望它在中断之前就知道相关内容b)希望它的训练包含足够多相关内容，这样它才不会说谎。我得说，对于小说来说它就没那么好了，因为RAG似乎无法捕捉你可能问到的关于一本书的抽象概念。

讨论总结

原帖询问为何大AI公司不支持RAG解决方案，在评论区引发了广泛讨论。许多评论者指出实际上不少大公司已经有类似RAG的支持，如GPT、谷歌、Claude、亚马逊等。还有评论者分享了自己使用RAG的经验、探讨RAG在不同场景下的应用、构建RAG的工具和方法、大公司不支持的潜在原因等，整体氛围是大家各抒己见，进行理性的技术探讨。

主要观点

👍 很多大的AI公司已经有类似RAG的支持
- 支持理由：如GPT允许上传文件可被索引为RAG，谷歌有NotebookLM，Claude允许添加文件，亚马逊有AWS Search解决方案等众多例子。
- 反对声音：无。
🔥 构建标准RAG管道价值有限，构建100%准确的RAG较难
- 正方观点：构建一个标准的RAG管道比较容易，而构建100%准确的RAG很难，且数据清理、规范化、优化等才是公司提供服务或解决方案的方面。
- 反方观点：部分人认为RAG很有用，如在个人项目中比ChatGPT在信息检索方面表现好很多。
💡 不应依赖大企业构建所需工具
- 支持理由：大企业构建的工具往往不完善、限制过多，并且通常仅适用于自身模型。
- 反对声音：未提及。
🌟 大AI公司不支持RAG可能是因为利润空间问题
- 支持理由：除企业级别的服务外，所需的支持和个性化定制在其他方面利润微薄，如Vertex AI虽有RAG管道，但设置和支持成本高昂。
- 反对声音：未提及。
🤔 RAG在企业对企业（B2B）以及特定用户情境下非常有用
- 支持理由：在多租户共享模型且模型为特定领域时，RAG有其独特优势。
- 反对声音：未提及。

金句与有趣评论

“😂 Building a RAG is easy so there’s not a ton of value in building a standard pipeline. Building a RAG that is 100 % accurate is hard.”
- 亮点：简洁地阐述了构建RAG管道的价值判断，是关于RAG构建难度的代表性观点。
“🤔 Only matters is accuracy and speed.”
- 亮点：指出在RAG相关应用中准确性和速度是关键因素。
“👀 Oddly enough Google seem to be leading the big companies on this front. And no other front. NotepadLM is worth a try.”
- 亮点：强调了谷歌在RAG解决方案方面处于大公司中的领先地位，并推荐了相关产品。
“💥 We can’t and shouldn’t rely on big corporations to build the tools we actually need, because they will usually be half - baked, over - restricted, and usually only applicable to their own models.”
- 亮点：表达对大企业构建工具的不信任，倡导构建开源工具系统以满足需求。
“😉 RAG just means to augment the system message or user message with additional information.”
- 亮点：对RAG的含义进行了一种简洁的解释。

情感分析

总体情感倾向较为理性中立。主要分歧点在于大AI公司是否支持RAG解决方案以及RAG本身的价值。原帖作者认为大AI公司不支持RAG解决方案，但很多评论者指出其实不少大公司已经有类似支持，这一分歧可能源于对RAG定义理解的差异以及对各公司相关功能的了解程度不同。对于RAG价值的分歧，部分人认为构建标准RAG管道价值不大，而有些人则在实际应用中发现RAG非常有用。

趋势与预测

新兴话题：Graph RAG可能成为新兴话题，有评论者对其好奇且认为比基本的RAG更有前景，后续可能会有更多关于Graph RAG的讨论，包括其技术实现和应用场景等。
潜在影响：如果更多的公司重视RAG解决方案并加以完善和推广，可能会改变目前信息检索和处理的方式，在数据处理、人工智能应用等相关领域提高信息获取的准确性和效率。同时，对于企业和个人用户来说，可能会促使更多人探索如何将RAG与自己的业务或项目相结合。

详细内容：

标题：为何大型 AI 公司对 RAG 解决方案支持不足？

在 Reddit 上，一则关于“为何大型 AI 公司不支持 RAG 解决方案”的讨论引起了广泛关注。原帖作者表示自己在个人项目中使用本地 8b 网络和 RAG 取得了比最新 ChatGPT 更好的效果，特别是在数据召回和信息处理方面。此帖获得了众多点赞和大量评论，引发了关于 RAG 技术在实际应用中的可行性、准确性、成本以及在不同领域的适用性等多方面的热烈讨论。

讨论焦点与观点分析：

关于 RAG 技术的难度和复杂性：
- 有人认为构建一个简单的 RAG 不难，但要达到 100%准确却非常困难。数据清理、标准化和优化等环节才是公司提供服务和解决方案的重点。
- 也有人指出对于专业领域，如律师、医生等，对准确性的要求极高，接近零误差，因此构建高度优化和准确的 RAG 至关重要。
关于 RAG 与现有模型的比较：
- 有人亲身体验将大量数据库数据输入 LLM 后，发现其速度慢、召回率低且成本高，相比之下 RAG 表现更优。
- 但也有人认为在创意写作等领域，大型模型如 Claude 和 GPT 的新模型更出色。
关于 RAG 在不同领域的应用：
- 有人以法律和医疗领域为例，说明高效准确的 RAG 能够节省大量时间和提高工作效率。
- 也有人分享了在桌面角色扮演游戏（TTRPG）等特殊数据类型中的应用经验。
关于 RAG 的实现方式和工具：
- 有人分享了使用 FAISS 和 transformers 库的 Python 工作流程，以及通过页面或块对输入文档进行处理的方法。
- 还有人探讨了不同的嵌入模型、索引方式以及相关的技术挑战。

有趣的观点和案例： - 有人将桌面角色扮演游戏的记录转录输入 NotebookLM，并取得了良好的效果。 - 有人正在将 Obsidian 中的笔记与 Misty 和小 LLM 连接，设置简单且实用。

在这场讨论中，虽然对于 RAG 技术存在诸多不同的看法，但也达成了一些共识，例如都认可 RAG 技术在特定场景下具有巨大潜力，但在准确性、实现成本和应用范围等方面仍存在诸多挑战。一些独特而有见地的观点，如对不同领域应用的具体分析和对未来发展的预测，丰富了整个讨论，让人们对 RAG 技术有了更全面深入的理解。

讨论总结#

主要观点#

金句与有趣评论#

情感分析#

趋势与预测#

详细内容：#