原贴链接

是否有人见过大规模生产中的AI智能体？如果AI智能体太慢、太贵且太不可靠，那么不管你使用Swarm、langchain还是其他AI智能体编排框架都没有意义。我之前写过一篇关于《AI智能体的炒作与现实》（https://www.kadoa.com/blog/ai-agents-hype-vs-reality）的文章，我认为情况至今仍未改变。通过结合严格受限的大型语言模型（LLM）、良好的评估数据、人工介入监督以及传统工程方法，我们可以在自动化中等复杂任务方面取得可靠的良好结果。AI智能体会自动执行繁琐的重复性工作，如网络爬虫、表单填写和数据录入吗？是的，肯定会。AI智能体在没有你干预的情况下自动为你预订假期吗？不太可能，至少在近期不太可能。你的实际使用案例和经验是什么？

讨论总结

这个讨论围绕AI代理是否在大规模生产环境中工作展开。原帖质疑AI代理在大规模生产应用中的现状，指出其存在速度慢、昂贵、不可靠等问题。评论者们从不同角度发表看法，包括AI代理的可靠性、自主性、不同企业的采用情况、人类参与的必要性，也有人提供了AI代理在大规模生产中工作的实例或者可能的实例。

主要观点

👍 AI代理目前还处于实验阶段。
- 支持理由：部分评论者表示目前人们只是在对AI代理进行实验，还未广泛应用于大规模生产。
- 反对声音：有评论者称自己看到AI代理在大规模生产中工作。
🔥 AI代理的不可靠性是主要问题。
- 正方观点：如在自动回归生成过程中的偏差对代理是致命的，特定格式输出时可靠性大幅下降等。
- 反方观点：有评论者表示自己看到AI代理在大规模生产中运行良好。
💡 存在AI代理在大规模生产中工作的情况。
- 解释：有评论者称见到AI代理在大规模生产中工作，但不能透露太多细节，也有给出如Narrot.org、Clay.com等实例的。
🤔 AI代理不会在无用户干预下预订假期。
- 解释：与人类参与相关，认为很多人类流程仍需用户参与，AI代理无法完全自主。
😎 部分人不认为多邻国使用基于AI聊天的角色属于AI agents。
- 解释：对于AI代理的定义存在不同理解。

金句与有趣评论

“😂 bgighjigftuik：No. People are just experimenting. The unreliability is still a major issue: any derailing in the auto - regressive generation process can be fatal for an agent”
- 亮点：直接指出AI代理目前处于实验阶段且不可靠性是大问题。
“🤔 我认为你问错了问题，并且是将其与计算机程序而非人进行比较。”
- 亮点：对原帖的比较对象提出新看法。
“👀 Yeah, can’t disclose too many details but it can scale.”
- 亮点：暗示有AI代理在大规模生产工作但因某些原因不能透露细节。
“😉 mycolo_gist：Duolingo uses AI chat based characters at scale.”
- 亮点：提供多邻国使用AI聊天角色的信息。
“💪 Narrot.org kinda does that, we have proprietary model and our own agent framework”
- 亮点：给出Narrot.org在AI代理生产规模应用方面有成果的实例。

情感分析

总体情感倾向为中性偏质疑。主要分歧点在于AI代理是否可靠以及是否真正在大规模生产中有效工作。可能的原因是大家的经验和观察角度不同，有的人看到了成功案例，有的人看到的是失败或者存在问题的情况。

趋势与预测

新兴话题：对于AI代理的评判标准的变化可能会引发后续讨论。
潜在影响：如果AI代理能够在大规模生产中可靠运行，将对相关企业的自动化进程产生重大影响，可能会改变一些行业的工作模式。

详细内容：

标题：关于 AI 代理在大规模生产中应用的热门讨论

在 Reddit 上，一篇题为“Has anyone seen AI agents working in production at scale?”的帖子引起了广泛关注。该帖指出，尽管 AI 代理存在速度慢、成本高和不可靠等问题，但通过特定方法仍能在中等复杂任务自动化方面取得较好成果。同时，也探讨了其在不同场景下的应用可能性，比如能否自主预订假期等，并询问了大家的实际使用案例和经验。此帖获得了众多的点赞和大量的评论。

讨论的焦点主要集中在 AI 代理的可靠性和实际应用场景。有人表示，目前人们对 AI 代理的应用还处于试验阶段，其不可靠性仍是主要问题。例如，有用户说：“任何在自回归生成过程中的偏差都可能对代理造成致命影响。” 还有用户提到：“当需要语言模型以特定格式输出时，其可靠性会大幅下降。”但也有不同的声音，比如有用户称：“JSON 模式在 OpenAI API 中可行，能强制输出有效的 JSON，虽然存在一些不理想的行为，但总体很有用。”

对于 AI 代理在实际生产中的应用，有人分享了自己的经历。比如，“我一直在断断续续地尝试为类似任务获得可靠的自动化，尝试了多种方法，但都存在问题。” 也有人认为，像 Duolingo 这样的公司在大规模使用 AI 代理方面有一定成果。

同时，大家对于“大规模”的定义也存在争议。有人认为企业服务中 AI 代理的规模与互联网公司或云数据规模公司不同，需要根据企业数据和工作流程进行调整。还有人质疑一些所谓的“大规模应用”其实更多是传统程序的包装。

总的来说，AI 代理在大规模生产中的应用仍面临诸多挑战，但也有一些积极的探索和实践。未来，我们或许需要在技术突破、应用优化和可靠性提升等方面持续努力，以实现更广泛和有效的应用。

讨论总结#

主要观点#

金句与有趣评论#

情感分析#

趋势与预测#

详细内容：#