应用与工具 RAG应用

给大家的小礼物:一个易于使用的离线API,提供完整的维基百科文章。启动它,向端点发送查询/提示,获取匹配的完整维基文章进行RAG。

讨论围绕一个离线维基百科全文API项目展开,涉及其功能、使用技术、操作系统兼容性、动机及未来扩展的可能性。

 ·  · 
应用与工具 RAG应用

我正在进行的项目是一个单文件(现已超过1400行)的.py聊天应用程序,旨在尽可能多地集成与本地模型等聊天的功能。我刚刚添加了简易的RAG支持。请告诉我您的想法。

Reddit用户对一个包含1400行代码的本地聊天应用程序表示赞赏,并提出了改进建议,如显示每秒生成的令牌数和添加测试。

 ·  · 
应用与工具 RAG应用

改善相似性搜索的技巧

讨论围绕如何改进公司会计报表的相似性搜索,以避免不同公司资产信息的混淆,主要提出了使用关系型数据库和命名实体识别等方法。

 ·  · 
应用与工具 RAG应用

数据图谱RAG应用指南

Reddit用户围绕GraphRAG应用程序的功能展示、用户教程需求、数据处理和项目实际应用价值展开了深入讨论。

 ·  · 
应用与工具 RAG应用

RAG来源计算

讨论围绕RAG模型中如何通过注意力机制确定LLM对特定文档的关注程度,以及在量化模型和不同框架中的应用。

 ·  · 
应用与工具 RAG应用

我为代码仓库实现了RAG,以提供新代码生成的上下文。以下是在仅有16GB内存和约5k上下文窗口的Apple M1 Pro机器上,Llama-3.1-8B量化版本的表现。

Reddit用户对在Apple M1 Pro机器上使用量化版本的Llama-3.1-8B实现RAG以提供新代码生成上下文的方法表示赞赏和兴趣,并寻求更多技术细节和代码实现。

 ·  ·