原贴链接

大家好,最近我一直在深入研究这些“深度研究”人工智能工具,像OpenAI的产品、谷歌的Gemini版本、Perplexity,甚至GitHub上的一些开源工具。你知道的,就是那些承诺为你承担深度研究所有繁重工作的工具。我原本超级兴奋的。我的意思是,这个想法很棒,对吧?终于有一个能处理文献综述、合成数据并撰写完整报告的人工智能助手了?我肯定想用!但是使用了一段时间后,我总是感觉缺了点什么。对我来说,最大的问题是准确性。我不得不对很多内容进行事实核查,而且经常发现内容完全错误。更糟糕的是,它还编造不存在的来源!而且内容也相当表面。它确实能获取信息,但经常忽略整体语境。我很少能从中得到真正新的见解。而且它只是从网上抓取内容,却不检查来源是博客还是同行评审的期刊。一旦它开始出错,就很难纠正这个工具。甚至都不用提数据访问的限制了——我知道,现在还处于早期阶段。但是能够获取私人信息会非常有用!我能看到这里的潜力,真的。上传文件、提出棘手的问题、获得结构化的报告……这是很大的进步,但我原本希望在节省时间方面有一个突破。我只是有点不满意,希望能有更好一点的工具。所以,只有我这么觉得吗?你们的体验如何?有没有人真的找到一个很棒的工具呢,还是我们都只是在测试昂贵(而且有时候不准确)的搜索引擎呢?总结:这些“深度研究”人工智能工具很酷,但仍然存在准确性问题、缺乏语境并且需要更多数据访问权限。说实话,有点失望。

讨论总结

原帖作者对OpenAI、Google等的深度研究AI工具感到失望,认为存在准确性问题、缺乏深度、数据访问受限等。评论者们大多认同这些问题,部分分享了自己使用不同工具(如Perplexity、Grok 3、ChatGPT等)的体验,有好有坏。还有人将AI工具与互联网发展类比,有人讨论到AGI相关话题,也有人提出当前AI工具的商业模式主要靠炒作等多种观点。

主要观点

  1. 👍 深度研究工具存在准确性、深度、数据访问等问题
    • 支持理由:原帖作者提到使用时发现准确性不足,很多内容需事实核查,评论者也有类似经历,如使用深度研究模式对熟悉主题查询结果十有八九错误。
    • 反对声音:部分评论者认为工具还是有一定用处,如在某些简单任务或特定领域。
  2. 🔥 AI工具目前只是浅层次研究
    • 正方观点:一些评论者指出这些工具只是表面获取信息,缺乏深度,例如存在编造内容、引用支持不存在主题等情况。
    • 反方观点:有评论者分享了使用某些工具在特定任务上取得较好成果的经历,如在Grok 3深度模块处理棘手人文问题。
  3. 💡 当前AI工具对个人价值与早期谷歌搜索无异
    • 解释:有评论者从国家/产业和个人两个角度分析,认为虽然从国家或产业角度能提升生产力,但对个人而言没有使工作自动化,价值类似早期谷歌搜索。
  4. 💡 不同AI工具在不同任务上各有优劣
    • 解释:例如有评论者认为Perplexity日常使用最佳,Grok 3表现不错但不及Perplexity,ChatGPT用时较长且不比Perplexity好。
  5. 💡 当前人工智能只对少数人在少数方面有用且影响具有垂直性
    • 解释:评论者指出如聊天机器人用于客服、LLM用于编码等不同类型人工智能有不同应用场景,不会像人们认为的那样取代很多西方人的工作。

金句与有趣评论

  1. “😂 A few things are missing. They don’t know how to weight sources properly, like they don’t go and download a government budget pdf and read it if I ask a question about the budget for example.”
    • 亮点:生动地指出深度研究工具在来源权重判断上的问题。
  2. “🤔 Its shallow reasearch for now, but that wont sell well…”
    • 亮点:简洁地表达了当前AI工具浅层次研究的观点。
  3. “👀 Pretty much all the deep research I’ve tried so far is shit.”
    • 亮点:直接表达对深度研究结果的不满态度。
  4. “😎 I find Perplexity is the best for daily use, as it might only take 2 minutes.”
    • 亮点:明确给出Perplexity在日常使用中的优势。
  5. “🤨 I’ve been quite impressed by ChatGPT deep research.”
    • 亮点:与众多对深度研究工具失望的观点不同,提供了正面评价。

情感分析

总体情感倾向为负面,主要分歧点在于对深度研究AI工具是否有用以及有用程度的看法。持负面态度的人认为工具存在准确性等诸多问题,远没有达到宣传的效果;而正面评价的人则认为在某些任务或情况下工具是有用的。产生分歧的可能原因是使用场景、对工具的期望以及使用的工具种类不同等。

趋势与预测

  • 新兴话题:AGI是否即将到来,不同类型人工智能的应用场景,未来是否会是知识数据库取代搜索引擎。
  • 潜在影响:如果AI工具准确性等问题得不到改善,可能会影响人们对AI技术的信任和使用热情;如果人工智能的发展如部分人所预测,将对不同行业的就业结构和工作方式产生影响。

详细内容:

《对“深度研究”AI 工具的热议:潜力与不足》

在 Reddit 上,一篇关于“深度研究”AI 工具的讨论引起了众多用户的关注。原帖作者对这类工具充满期待,使用后却感到有些失望。这些工具包括 OpenAI 的产品、Google 的 Gemini 版本、Perplexity 以及一些开源工具。

原帖获得了大量的点赞和评论,引发了关于这些工具准确性、能否理解上下文、数据获取限制等方面的热烈讨论。

讨论的焦点观点多样。有人指出这些工具不懂得正确权衡信息来源,也缺乏代理行为,比如无法与网站互动获取更准确的信息。还有人认为其缺乏上下文推理能力,不能根据领域的发展变化合理权衡信息。

有人分享了自己的经历,比如[FullOf_Bad_Ideas]通过 OpenAI 深度研究找到了合适的电脑机箱,节省了时间。但也有很多人表示在不同领域使用时遇到了各种问题,比如[tatamigalaxy_]作为社会学学生,发现其对自己的学士论文帮助有限。

一些用户认为这些工具目前还只是浅层研究,比如[ColorlessCrowfeet]。但也有人觉得尽管有缺陷,还是有一定用处,比如[Strel0k]就认为它能节省不少研究时间。

对于未来的发展,大家看法不一。有人觉得还有很大提升空间,比如[BidWestern1056]认为需要让其具备更多代理能力。也有人对其前景不太乐观,像[kovnev]就认为是算力限制导致了工具的不足。

总的来说,关于“深度研究”AI 工具,大家既有期待也有不满,它们在带来便利的同时,也存在诸多需要改进的地方。未来它们能否真正实现突破,满足人们的期望,还有待观察。