SWE - agent是一个开源软件工程代理,可与任何类型的模型协同工作。我们的1.0版本增加了大量新功能:大规模并行运行、基于云的部署、借助工具包实现广泛的可配置性、新的命令行界面和实用程序。完全开源(MIT协议),广泛的配置,易于修改。由于它使用LiteLLM进行语言模型接口连接,所以你可以将它与本地语言模型一起使用:我们已经将它与通义千问(Qwen)一起使用,其他社区成员也已将它与羊驼(Llama)一起使用。
[https://github.com/swe - agent/swe - agent](https://github.com/swe - agent/swe - agent)
SWE - agent现在由我们新的SWE - ReX包提供支持,这是一个轻量级、通用的沙盒式代码执行引擎,支持本地Docker、AWS、Modal部署[https://github.com/SWE - agent/swe - rex](https://github.com/SWE - agent/swe - rex)。你可以使用它轻松构建自己的代理,并从头开始执行代码,而无需费心弄清楚如何与运行中的docker容器通信!
讨论总结
此贴围绕SWE - agent展开讨论,SWE - agent是一个开源的软件工程代理,相关的SWE - rex是一个沙箱代码执行引擎。大家讨论的话题涉及SWE - rex的教程实用性、SWE - agent的成本统计、它与其他工具(如e2b)的对比、是否使用了RAG技术,还有人提出了关于LLM预处理代码库的想法等,整体氛围积极,参与者积极交流技术相关的内容。
主要观点
- 👍 SWE - rex教程看起来用处不大
- 支持理由:原评论者Paulonemillionand3指出教程不实用并给出链接
- 反对声音:无
- 🔥 swe - rex是执行代理操作的辅助包
- 正方观点:klieret解释swe - rex的功能性质
- 反方观点:无
- 💡 对SWE - agent感兴趣并询问相关成本与适配LLMs的情况
- 解释:评论者HNipps觉得SWE - agent很酷并询问相关成本与适配LLMs的情况,体现出对这个工具的关注与探索欲
- 💡 swe - rex与e2b有不同的应用场景
- 解释:klieret详细解答二者区别,指出e2b和swe - rex在不同用例下的适用性
- 💡 认为SWE - agent看起来很不错且提出LLM预处理代码库的思路
- 解释:RabbitContrarian肯定SWE - agent,同时提出预处理代码库的想法,为技术探讨提供新方向
金句与有趣评论
- “😂 Paulonemillionand3:The tutorial does not seem very useful. [https://swe - rex.com/latest/usage/]”
- 亮点:直接指出SWE - rex教程存在的问题,开启关于教程有用性的讨论。
- “🤔 klieret:swe - rex is the "helper" package that we use to execute the actions of the agent, the actual agent has much more tutorials, e.g., here: https://swe - agent.com/latest/usage/hello_world/.”
- 亮点:清晰解释swe - rex与实际代理在教程方面的情况,让大家对二者关系有更明确的认识。
- “👀 klieret: e2b is great but it seems like it’s mostly targeting use cases where a LM generates some code, you run it, and then you’re done.”
- 亮点:很好地阐述了e2b的应用场景,有助于对比理解swe - rex。
- “😎 RabbitContrarian: This looks great.”
- 亮点:简单直接地表达对SWE - agent的肯定态度。
- “🧐 HNipps: Super cool! Any stats on how many tokens used in an average workflow or model provider costs?”
- 亮点:表达对SWE - agent的兴趣并提出有关成本等数据的疑问,引出更多技术信息的分享。
情感分析
总体情感倾向是积极的。主要分歧点较少,主要集中在SWE - rex教程的实用性方面,可能是因为不同用户对工具的需求和理解不同,有的用户觉得教程不够直观有用,而有的用户则理解其技术文档性质所以觉得正常。
趋势与预测
- 新兴话题:LLM预处理代码库的思路可能会引发后续关于如何优化SWE - agent处理代码库的讨论。
- 潜在影响:如果关于成本统计、与其他工具对比等方面的讨论继续深入,可能会影响到相关开源软件工程代理工具在市场上的定位和使用策略。
详细内容:
《SWE-agent 开源软件工程代理:引发热议的创新工具》
近日,Reddit 上关于“SWE-agent 是 SWE-bench Lite 上的新开源 SOTA”这一话题引起了广泛关注。该帖子介绍了 SWE-agent 这一开源软件工程代理的诸多新特性,包括大规模并行运行、基于云的部署、广泛的可配置性以及新的命令行界面和实用工具等,并且完全开源(MIT),易于修改。同时,还提到了其使用 LiteLLM 进行 LM 接口,可与本地 LM 配合使用,还公布了相关的链接https://github.com/swe-agent/swe-agent 。此贴获得了大量的点赞和众多评论。
讨论的焦点主要集中在以下几个方面: 有人指出教程不太有用,而有人回应称实际的代理有更多教程。还有人认为如今非常需要一个简单可靠的沙盒代码执行工具,并希望能有更多文档。
有用户分享道:“我们的排行榜结果是由 Claude 3.5 Sonnet(20241022)作为主要驱动的。我们进行了 10 次尝试,然后通过向 o1 提供所有生成的补丁和一些上下文来挑选最佳结果。每次尝试大约花费 0.50 美元(有提示缓存)。”
有人提问:“超级酷!平均工作流中使用了多少令牌或者模型提供者的成本是多少?”“它与哪些 LLMs 配合效果最佳?”
有人好奇地询问:“抱歉,有点小白的问题,swe-rex 与 e2b 相比如何?”对此,有人回应称:“e2b 很棒,但它似乎主要针对 LM 生成一些代码,运行后就结束的用例。而对于代理的需求在于有一个更长的运行 shell 会话,需要进行多次交互。而且 swe-rex 的代码库很小,很容易通过特定的 API 端点进行扩展。”
讨论中的共识在于大家对 SWE-agent 充满期待,希望它能不断完善和优化。独特的观点如关于模型驱动和成本的分享,以及对与其他类似工具对比的分析,丰富了讨论的内容。
总之,SWE-agent 引发了大家对开源软件工程代理的热烈讨论和深入思考,未来其发展令人期待。
感谢您的耐心阅读!来选个表情,或者留个评论吧!