原贴链接

我需要为公司创建一个聊天机器人，帮助员工回答有关内部指令/文档（300+）的问题并搜索这些文档。由于安全政策，所有内容必须采用本地解决方案。LLM+RAG适合这个任务吗？我听说它在深层上下文链接方面存在问题。你认为最佳方案是什么，我应该注意什么？我已经尝试了OpenWebUI与Ollama（尚未使用RAG），感觉效果不错。感谢所有建议！

讨论总结

本次讨论聚焦于如何构建一个高效的企业内部文档查询聊天机器人。帖子作者询问了LLM+RAG方案的有效性，并引发了关于技术选择、数据治理、可扩展性等方面的深入探讨。评论者们分享了各自的经验和建议，涉及多种工具和方法，如Ollama、OpenWebUI、Dify、ColPali等，并强调了处理未经训练数据和复杂文档（如含表格和图片的文件）的挑战。总体氛围积极，参与者乐于分享和探讨解决方案。

主要观点

👍 LLM+RAG的适用性
- 支持理由：适用于企业内部文档问答，但需注意其局限性。
- 反对声音：不适合处理全局性问题。
🔥 数据治理与可扩展性
- 正方观点：为整个公司构建聊天机器人需考虑数据治理和可扩展性。
- 反方观点：个人使用相对简单，企业应用复杂度高。
💡 实用工具推荐
- Ollama + OpenWebUI和Dify易于设置且支持RAG和多用户功能。
- ColPali在处理PDF文档方面表现优越。
📊 文档处理挑战
- 处理含表格和图片的文档是难题，需转换为文本。
- 视觉语言模型可辅助提取图片内容。
🛠 综合解决方案
- 使用本地模型，结合多种检索和优化技术。
- 持续预训练和微调模型以提高性能。

金句与有趣评论

“😂 This will get much, much more complicated the more corporate features your try to add.”
- 亮点：简洁指出企业特性增加带来的复杂度。
“🤔 LLM+RAG is exactly for that. Just don’t expect it to work for ‘global’ kinds of questions.”
- 亮点：明确指出LLM+RAG的适用范围。
“👀 Documents with tables are a pain, and so are pictures.”
- 亮点：生动描述处理复杂文档的难点。
“🔧 Use a local model, which one depends on how high your budget is / how much compute you have.”
- 亮点：实用建议，考虑预算和计算资源。
“🌟 Be very mindful of the start, if people don’t get the answers they want they’ll stop using it.”
- 亮点：强调初始阶段用户满意度的重要性。

情感分析

总体情感倾向积极，参与者乐于分享经验和建议。主要分歧点在于技术选择的适用性和实施难度，部分评论者对LLM+RAG的局限性表示担忧，但也有不少人提供了具体的解决方案和工具推荐。讨论氛围友好，充满建设性。

趋势与预测

新兴话题：结合视觉语言模型处理复杂文档，使用本地模型和多步骤检索优化。
潜在影响：推动企业内部聊天机器人技术的成熟和应用，提升信息管理效率。

详细内容：

标题：关于为企业创建内部问答聊天机器人的热门讨论

在 Reddit 上，有一则关于为企业创建能够帮助员工回答有关内部指令和文档（多达 300 多个）并进行搜索的聊天机器人的帖子引发了广泛关注。该帖子获得了众多的点赞和大量的评论。

原帖作者询问由于企业安全政策限制，一切都需在本地解决的情况下，LLM+RAG 是否适用于此任务，还提到自己已尝试 OpenWebUI 与 Ollama（尚未使用 RAG），并认为效果不错，同时希望得到更多建议。

讨论的焦点主要集中在以下几个方面：有人认为随着添加更多企业功能，任务会变得极其复杂，处理未训练数据时消除幻觉并非易事，但自己制作一个满足个人需求的还比较容易，而要使其适用于整个公司，考虑到数据治理、可扩展性等则更具挑战性，不过这一过程充满乐趣且能学到很多。有人指出 LLM+RAG 正适用于此，但不要期望它能处理“全局”类问题。也有人表示混合使用检索器和 Python 代码执行代理来进行语义和严格搜索，“文档中提到 N 的次数”这类问题处理得很好。还有人推荐了 Ollama + Open WebUI 或 Dify，认为它们设置简单，具备 RAG 和多用户功能。有人使用 LangChain 进行了概念验证，提到处理含表格和图片的文档有困难，计划将表格重述为文本、图片转为描述但时间不足。也有人推荐使用 ColPali 处理 PDF 到文本的转换，认为其效果出色。

此外，有人建议将 300 个文档放入一个大型知识库，考虑使用 SQL，使用本地模型并根据预算和计算资源选择，进行预处理如数据标注、总结等，使用晚期交互检索器，利用 DSPy 优化，进行多步检索等。还有人提到设置温度为零、为常见问题制作模板、记录用户提问类型让模型分类、关注开头使用效果、确保有经过良好测试的有效提示等。

在这场讨论中，各方观点丰富多样，既有对技术选择和应用难点的深入分析，也有实用的操作建议。但对于究竟哪种方法是最佳选择，仍存在一定的争议，这也反映了在为企业创建聊天机器人这一任务中的复杂性和多样性。

讨论总结#

主要观点#

金句与有趣评论#

情感分析#

趋势与预测#

详细内容：#