原贴链接

大家好，最近我一直在深入研究这些“深度研究”人工智能工具，像OpenAI的产品、谷歌的Gemini版本、Perplexity，甚至GitHub上的一些开源工具。你知道的，就是那些承诺为你承担深度研究所有繁重工作的工具。我原本超级兴奋的。我的意思是，这个想法很棒，对吧？终于有一个能处理文献综述、合成数据并撰写完整报告的人工智能助手了？我肯定想用！但是使用了一段时间后，我总是感觉缺了点什么。对我来说，最大的问题是准确性。我不得不对很多内容进行事实核查，而且经常发现内容完全错误。更糟糕的是，它还编造不存在的来源！而且内容也相当表面。它确实能获取信息，但经常忽略整体语境。我很少能从中得到真正新的见解。而且它只是从网上抓取内容，却不检查来源是博客还是同行评审的期刊。一旦它开始出错，就很难纠正这个工具。甚至都不用提数据访问的限制了——我知道，现在还处于早期阶段。但是能够获取私人信息会非常有用！我能看到这里的潜力，真的。上传文件、提出棘手的问题、获得结构化的报告……这是很大的进步，但我原本希望在节省时间方面有一个突破。我只是有点不满意，希望能有更好一点的工具。所以，只有我这么觉得吗？你们的体验如何？有没有人真的找到一个很棒的工具呢，还是我们都只是在测试昂贵（而且有时候不准确）的搜索引擎呢？总结：这些“深度研究”人工智能工具很酷，但仍然存在准确性问题、缺乏语境并且需要更多数据访问权限。说实话，有点失望。

讨论总结

原帖作者对OpenAI、Google等的深度研究AI工具感到失望，认为存在准确性问题、缺乏深度、数据访问受限等。评论者们大多认同这些问题，部分分享了自己使用不同工具（如Perplexity、Grok 3、ChatGPT等）的体验，有好有坏。还有人将AI工具与互联网发展类比，有人讨论到AGI相关话题，也有人提出当前AI工具的商业模式主要靠炒作等多种观点。

主要观点

👍 深度研究工具存在准确性、深度、数据访问等问题
- 支持理由：原帖作者提到使用时发现准确性不足，很多内容需事实核查，评论者也有类似经历，如使用深度研究模式对熟悉主题查询结果十有八九错误。
- 反对声音：部分评论者认为工具还是有一定用处，如在某些简单任务或特定领域。
🔥 AI工具目前只是浅层次研究
- 正方观点：一些评论者指出这些工具只是表面获取信息，缺乏深度，例如存在编造内容、引用支持不存在主题等情况。
- 反方观点：有评论者分享了使用某些工具在特定任务上取得较好成果的经历，如在Grok 3深度模块处理棘手人文问题。
💡 当前AI工具对个人价值与早期谷歌搜索无异
- 解释：有评论者从国家/产业和个人两个角度分析，认为虽然从国家或产业角度能提升生产力，但对个人而言没有使工作自动化，价值类似早期谷歌搜索。
💡 不同AI工具在不同任务上各有优劣
- 解释：例如有评论者认为Perplexity日常使用最佳，Grok 3表现不错但不及Perplexity，ChatGPT用时较长且不比Perplexity好。
💡 当前人工智能只对少数人在少数方面有用且影响具有垂直性
- 解释：评论者指出如聊天机器人用于客服、LLM用于编码等不同类型人工智能有不同应用场景，不会像人们认为的那样取代很多西方人的工作。

金句与有趣评论

“😂 A few things are missing. They don’t know how to weight sources properly, like they don’t go and download a government budget pdf and read it if I ask a question about the budget for example.”
- 亮点：生动地指出深度研究工具在来源权重判断上的问题。
“🤔 Its shallow reasearch for now, but that wont sell well…”
- 亮点：简洁地表达了当前AI工具浅层次研究的观点。
“👀 Pretty much all the deep research I’ve tried so far is shit.”
- 亮点：直接表达对深度研究结果的不满态度。
“😎 I find Perplexity is the best for daily use, as it might only take 2 minutes.”
- 亮点：明确给出Perplexity在日常使用中的优势。
“🤨 I’ve been quite impressed by ChatGPT deep research.”
- 亮点：与众多对深度研究工具失望的观点不同，提供了正面评价。

情感分析

总体情感倾向为负面，主要分歧点在于对深度研究AI工具是否有用以及有用程度的看法。持负面态度的人认为工具存在准确性等诸多问题，远没有达到宣传的效果；而正面评价的人则认为在某些任务或情况下工具是有用的。产生分歧的可能原因是使用场景、对工具的期望以及使用的工具种类不同等。

趋势与预测

新兴话题：AGI是否即将到来，不同类型人工智能的应用场景，未来是否会是知识数据库取代搜索引擎。
潜在影响：如果AI工具准确性等问题得不到改善，可能会影响人们对AI技术的信任和使用热情；如果人工智能的发展如部分人所预测，将对不同行业的就业结构和工作方式产生影响。

详细内容：

《对“深度研究”AI 工具的热议：潜力与不足》

在 Reddit 上，一篇关于“深度研究”AI 工具的讨论引起了众多用户的关注。原帖作者对这类工具充满期待，使用后却感到有些失望。这些工具包括 OpenAI 的产品、Google 的 Gemini 版本、Perplexity 以及一些开源工具。

原帖获得了大量的点赞和评论，引发了关于这些工具准确性、能否理解上下文、数据获取限制等方面的热烈讨论。

讨论的焦点观点多样。有人指出这些工具不懂得正确权衡信息来源，也缺乏代理行为，比如无法与网站互动获取更准确的信息。还有人认为其缺乏上下文推理能力，不能根据领域的发展变化合理权衡信息。

有人分享了自己的经历，比如[FullOf_Bad_Ideas]通过 OpenAI 深度研究找到了合适的电脑机箱，节省了时间。但也有很多人表示在不同领域使用时遇到了各种问题，比如[tatamigalaxy_]作为社会学学生，发现其对自己的学士论文帮助有限。

一些用户认为这些工具目前还只是浅层研究，比如[ColorlessCrowfeet]。但也有人觉得尽管有缺陷，还是有一定用处，比如[Strel0k]就认为它能节省不少研究时间。

对于未来的发展，大家看法不一。有人觉得还有很大提升空间，比如[BidWestern1056]认为需要让其具备更多代理能力。也有人对其前景不太乐观，像[kovnev]就认为是算力限制导致了工具的不足。

总的来说，关于“深度研究”AI 工具，大家既有期待也有不满，它们在带来便利的同时，也存在诸多需要改进的地方。未来它们能否真正实现突破，满足人们的期望，还有待观察。

讨论总结#

主要观点#

金句与有趣评论#

情感分析#

趋势与预测#

详细内容：#