原贴链接

是的,多亏了Github上的人帮我更新,现在它可以与OpenAI兼容端点一起工作了。以下是这个项目的回顾:

自动化AI网络研究员:经过数月的工作,我制作了一个Python程序,它能将在Ollama上运行的本地大型语言模型(LLM)变成在线研究员。你只需输入一个问题或主题,然后等一会儿就能得到一个充满研究内容、带有来源链接和摘要的文本文档,还可以对其提问等等。

我的项目功能

这个自动化研究员利用网络搜索和网页抓取来收集信息,根据你选择的主题或问题,它会生成与主题相关的重点研究领域,旨在探索主题的各个方面,通过在线研究检索相关信息来回应你的主题或问题。LLM会将你的查询分解成最多5个具体的研究重点,根据相关性进行排序,然后从最相关的开始,通过有针对性的网络搜索和内容分析系统地研究每个重点。

然后在从这些搜索中收集内容并完成所有重点领域的研究后,它会审查内容并利用其中的信息生成新的重点领域。过去,它经常根据已经收集到的研究内容发现新的、相关的重点领域(例如特定的案例研究,然后它会专门寻找与你的主题或问题相关的案例)。虽然情况可能有所不同,这个程序仍然是一个原型,但令人震惊的是,它确实有效。

主要功能:

  • 根据发现持续生成新的研究重点;
  • 完整保存找到的每一条内容以及来源网址;
  • 在完成研究后创建一个全面的摘要,并利用它来回答你最初的查询/问题;
  • 在提供摘要后进入对话模式,你可以就其发现和研究提出具体问题,即使是摘要中未提及的内容,如果研究发现提供了相关信息也可以提问;
  • 你可以让它一直运行,直到LLM的上下文达到最大值,这时它将自动停止研究,但仍然允许生成摘要和提问。或者随时停止它,这将导致它生成摘要;
  • 包含暂停功能以评估研究进展,确定是否已经收集到足够的信息,允许你选择继续或终止研究并接收摘要;
  • 适用于流行的Ollama本地模型(推荐phi3:3.8b - mini - 128k - instruct或phi3:14b - medium - 128k - instruct,这是我到目前为止测试过且有效的模型);
  • 一切都在你的机器上本地运行,但仍然能在相对较短的时间内给你返回大量来自互联网的实际研究结果。

最棒的是?你可以让它在后台运行,同时做其他事情。回来时会发现一个详细的研究文档,包含数十个相关来源和提取的内容,都已整理好可供查看。还有相关发现的摘要,并且能够就这些发现向LLM提问。非常适合研究、难以研究的和新奇的问题,或者只是满足你对复杂话题的好奇心。

带有完整说明和演示视频的GitHub仓库:

[https://github.com/TheBlewish/Automated - AI - Web - Researcher - Ollama](https://github.com/TheBlewish/Automated - AI - Web - Researcher - Ollama)

(使用Python构建,完全开源,应该适用于任何与Ollama兼容的LLM,尽管我只测试了Phi 3)

目标受众

任何重视本地运行LLM的人,任何想要通过单次输入进行全面研究的人,任何喜欢AI创新和新奇用法(据我所知,即使大公司也尚未尝试)的人。

如果你对AI感兴趣,如果你好奇它能做什么,好奇你能多么容易地利用它在网上找到高质量信息,那就来看看吧!

比较

与现有的程序和应用不同的是,它通过单次在线查询持续进行研究,可能进行数百次搜索,从每次搜索中收集内容,将内容保存到一个文档中,并附上收集信息的每个网站的链接。

同样,单次查询可能进行数百次搜索,而且不是随机搜索,每个搜索都是经过深思熟虑的,旨在探索你的主题/查询的各个方面以收集尽可能多的可用信息。

它不仅收集这些信息,还会对所有信息进行总结,在你结束研究会话时提取收集到的信息的所有相关方面,它会查看所有发现的内容并给你与问题相关的重要部分。然后你仍然可以就它发现的研究内容提出任何问题,它将利用收集到的任何信息来回答你的问题。

最重要的是,与ChatGPT等其他可以搜索互联网的服务相比,这个是完全开源的,并且100%在你自己的设备上本地运行,你可以选择任何LLM模型,尽管我只测试了Phi 3,其他模型可能也适用。

讨论总结

原帖发布了一个更新后的AI研究助手,具备网络搜索、内容抓取等功能。评论者从多个方面进行讨论,包括项目在Windows系统的运行问题、功能的完善(如搜索特定网站、处理PDF文件等)、对项目的认可,也提出了很多疑问,例如项目是否能避开机器人检测、是否类似于其他项目等,整体氛围以理性探讨为主。

主要观点

  1. 👍 项目有一定价值,受到部分评论者认可
    • 支持理由:如评论者称项目很棒、很酷,表示有尝试的意愿。
    • 反对声音:无。
  2. 🔥 项目在Windows系统存在运行问题
    • 正方观点:多位评论者指出项目在Windows系统下存在需求未修复、无法运行、运行中存在严重问题等情况。
    • 反方观点:有评论者通过特殊操作(如WSL)让其在Windows运行。
  3. 💡 项目功能存在一些局限性
    • 例如有评论者指出文档输出存在限制,也有评论者提出功能完善方向,如添加网络界面。
  4. 🤔 对项目技术方面存在疑问
    • 像项目使用的API选择、代码中函数缺失等方面被评论者提及。
  5. 😕 对项目的测试情况存疑
    • 有评论者认为项目发布者应更彻底测试项目,或者明确项目处于测试阶段并跟进问题。

金句与有趣评论

  1. “😂 Nice.”
    • 亮点:简单表达了对项目的认可态度,简洁明了。
  2. “🤔 MirtoRosmarino:This is great, I will check it out.”
    • 亮点:表明对项目的积极态度并传达出尝试项目的意愿。
  3. “👀 An interesting test would be to see if the research assistant could find the contents of a paywalled article (NYT or similar).”
    • 亮点:提出一个有趣的测试项目能力的方法。
  4. “😉 Awesome project, deserve a webui, and Windows compatibility”
    • 亮点:肯定项目的同时提出优化建议。
  5. “🙄 这项目在Windows上是完全坏掉的。”
    • 亮点:直白地表达项目在Windows系统的失败状况。

情感分析

总体情感倾向为中性偏负面。主要分歧点在于项目是否完善和实用。正面情感源于部分评论者认可项目的创意和潜力,负面情感则是由于项目在Windows系统下的运行问题、功能限制等,例如文档输出限制、在Windows系统下无法运行或者存在严重问题等情况,导致部分评论者失望或提出批评。

趋势与预测

  • 新兴话题:项目在特定场景(如学术论文搜索)下的功能拓展、如何解决Windows系统运行问题。
  • 潜在影响:如果项目能够解决现存问题并完善功能,可能会对AI研究辅助领域产生积极影响,吸引更多用户使用本地运行的AI研究工具;反之,如果问题持续存在,可能影响项目的推广和发展。

详细内容:

《创新 AI 研究助手在 Reddit 引发热烈讨论》

在 Reddit 上,一则关于更新后的 AI 研究助手的帖子引发了广泛关注。这个研究助手能够根据输入的任何主题进行网络搜索、抓取内容、保存来源并生成完整的研究文档和摘要,还能与 OpenAI 兼容端点以及 Ollama 协同工作。该帖子获得了众多点赞和评论。

主要的讨论方向包括工具在不同操作系统上的兼容性、能否规避网站的机器人检测、特定功能的实现以及与其他类似工具的比较等。

讨论焦点与观点分析如下:

  • 关于兼容性,有人指出 Windows 系统的要求尚未完善,如[Eisenstein]表示它需要 Unix 依赖的 termios,在 Windows 上运行存在问题。但也有人如[kajs_ryger]通过 WSL 成功在 Windows 上运行。
  • 对于能否绕过网站的机器人检测,[skripp11]指出该工具默认不处理,且存在忽略 robots.txt 的情况。
  • 在功能实现方面,[Fun_Librarian_7699]询问制作自己的 webscraper.py 时应考虑什么。
  • 与其他工具的比较中,[Ornery_Meat1055]认为它比简单的 LLM 总结关键词结果更深入。

讨论中的共识是这个工具具有创新性和潜力,但在一些方面还需要改进和完善。特别有见地的观点如[Innomen]对本地 AI 助手的期待,认为其可降低对专业知识的依赖。

总之,这个 AI 研究助手在 Reddit 上引起了热烈讨论,虽然存在一些问题,但也展现出了巨大的潜力和发展空间。