测试在中型代码库下最佳的开源AI编码工具。简而言之,这特别关注工具在10k +代码库中的性能,而非贪吃蛇游戏。Aider和Cline(就我的使用场景而言)表现相近,我更喜欢Aider。Aider更灵活:可作为开发版本运行,允许自定义修改(非自定义指令)。Aider可以使用您现有的20美元ChatGPT / Claude订阅等为您应用代码!在大中型代码库编码方面,Qwen 2.5 Coder 32B远不及DeepSeek 3。Aider便于携带:我在IDE和工具之间切换,不想受限于VSCode / 分支。Aider有脚本功能:可用于外部代理环境。Aider更经济:使用更少的令牌,尽管Cline试图添加差异。我可以在同一个代码库上同时使用Aider。Claude 3.5 Sonnet在较大代码库方面明显优于DeepSeek 3,但在其他方面较为接近。我认为我们已经可以不再针对简单任务对优秀的编码LLM和编码工具进行基准测试,而开始考虑组织/企业方面的情况。我正在研究CrewAI + Aider,看起来很有前景。如果感兴趣,这里有测试视频:https://youtu.be/e1oDWeYvPbY。请告诉我您在更具挑战性的环境中使用AI编码的经验。
讨论总结
原帖作者测试了Aider和Cline在中大型代码库中的表现,表达了对Aider的偏好,并提及多种AI编码工具的相关情况。评论者们的讨论主要集中在Aider的功能和使用体验上,如Aider的git集成、/ask功能、是否有重构模式等,也涉及到Aider与其他工具如Cursor的比较、Aider使用ChatGPT/Claude订阅的服务条款问题,以及对原帖测试结果的不同看法等,整体氛围以理性探讨为主。
主要观点
- 👍 Aider相比Cline更具优势
- 支持理由:Aider更灵活、可移植、经济,能使用现有订阅服务应用代码等
- 反对声音:无
- 🔥 Aider使用ChatGPT/Claude订阅可能违反服务条款
- 正方观点:操作可能是通过欺骗用户交互而非API,没有API的数据保护保障
- 反方观点:Aider操作谨慎,没有违反条款,如复制粘贴部分是手动操作
- 💡 Aider添加和删除文件到上下文窗口的方式存在问题
- 解释:这一方式很麻烦,希望有像Cline那样能妥善处理此问题的VS Code扩展
- 💪 Claude在某些方面优于Deepseek
- 解释:如处理上下文能力、在图像或语音处理方面,Deepseek被认为是廉价仿制品且基于Claude输出训练
- 🤔 对20k行代码是否算大型代码库存在疑问
- 解释:在推荐OpenHands + Claude处理大型代码库时引发了对20k行代码规模的疑惑
金句与有趣评论
- “32B vs 671B (MoE w/37B activate), hardly surprising.”
- 亮点:通过参数量解释Qwen 2.5 Coder 32B与DeeepSeek 3在编码表现上的差异
- “An easy task, which requires simple steps, but that I don’t want to do:”
- 亮点:表达出对嵌入YouTube视频到移动应用任务虽简单但繁琐不想做的态度
- “我使用aider基本上每天。”
- 亮点:表明aider的日常使用频率,体现用户对其的依赖
- “actionable:Aider has some cool features. Nice video too.”
- 亮点:简洁肯定Aider特性并对原帖视频给予正面评价
- “Armym: Does aider have the feature where you "apply code" and then can manually approve or remove certain changes? This is the best feature of cursor.”
- 亮点:引出Aider与Cursor功能比较的话题
情感分析
总体情感倾向较为中性,既有对Aider的肯定和支持,也有对其存在问题的指出和质疑。主要分歧点在于Aider使用ChatGPT/Claude订阅是否违反服务条款以及Aider与其他工具(如Deepseek、Cursor)的比较上。可能的原因是不同用户对工具的使用需求、使用场景以及对相关技术和规则的理解不同。
趋势与预测
- 新兴话题:Aider是否能增加重构模式以及如何改善文件处理方式。
- 潜在影响:对AI编码工具的开发和改进方向产生影响,促使开发者关注用户在使用工具时遇到的实际问题并进行优化;同时也会让更多用户关注到AI编码工具使用中的服务条款等合规性问题。
详细内容:
标题:Reddit 上关于开源 AI 编码工具的热门讨论
在 Reddit 上,一篇题为“I Tested Aider vs Cline using DeepSeek 3: Codebase >20k LOC…”的帖子引发了热烈关注。该帖子获得了众多点赞和大量评论,主要探讨了在中大型代码库中各种开源 AI 编码工具的表现。
原帖作者表示,在 10k+代码库的使用场景下,Aider 和 Cline 表现接近,且自己更倾向于 Aider。Aider 具有更灵活、可便携、支持脚本编写、更经济等优点,还能利用现有的 20 美元 ChatGPT/Claude 订阅服务来应用代码。同时,作者认为应将对编码工具的评估重点转向组织/企业应用。文中还提供了测试视频链接:https://youtu.be/e1oDWeYvPbY 。
讨论焦点与观点分析:
有人指出 Qwen 2.5 Coder 32B 在中大型代码库的编码能力远不如 DeeepSeek 3,认为参数规模差异大,不足为奇。但也有人认为 32B 的 Qwen 2.5 Coder 在其规模范围内是个不错的编码器。
有用户分享说每天都使用 aider,更看重 git 集成而非编辑器集成,希望 aider 能有重构模式以更好控制上下文和规划任务。有人提到 aider 的/architect 模式可能满足这一需求。
关于 Aider 利用 ChatGPT/Claude 订阅服务的问题,有人担心可能违反服务条款,但原帖作者提供链接解释这是手动操作,未违反条款。
还有用户提到 OpenHands + Claude 表现出色,有人质疑 20k 行代码是否算大型代码库。
有人指出 Aider 在添加和移除文件的操作上不够便捷,期待类似 cline 的优化。
有人认为 Claude 在处理大型代码库方面优于 deepseek,也有人持不同意见,认为两者不在同一水平。
有人认为视频中的示例是失败的,而原帖作者表示将提供嵌入式足球亮点视频的临时链接以供体验。
在这场讨论中,大家对于各种 AI 编码工具的优缺点和适用场景各抒己见,充分展现了对这一领域的关注和思考。
总之,通过这次 Reddit 上的讨论,让我们对开源 AI 编码工具在不同场景下的表现有了更全面的认识。
感谢您的耐心阅读!来选个表情,或者留个评论吧!