如果你了解我,你可能知道自从第一个Llama带着它那‘我的分词器有点问题,但我爱你’的风格出现以来,我对本地的大型语言模型(LLM)都很熟悉。所以这不是毫无根据的猜测。几天前,我在做一些C++编码工作时尝试了Claude,它的表现好得惊人,直到它想要钱(付费)。于是我在编码中途妥协了,就想看看它到底能做到什么程度。该死。太该死了。非常该死。事情是这样的:没有其他模型像Claude 3.5这样能理解代码,能力惊人。你可以反驳我,我会回击的。这个东西太疯狂了。我做的可不是简单的‘贪吃蛇游戏’之类的东西。我有25年的C++编程经验,所以当我需要解决一些我真正棘手的问题时。有很多次我都觉得这就是编码人工智能(而且我对把分词预测器称为人工智能非常谨慎),但它真的很疯狂。三天内,我编写了几个类,要是我自己来做可能需要几个月,而这个东西处理1万行代码的类就像嚼口香糖一样轻松。当然,当事情不顺利的时候,我也让它出过错……一次又一次。然后Claude编写了一整套新代码来测试旧代码,最后我们解决了问题。我的很多代码是关于视觉组件的,所以我会描述我在屏幕上看到的东西。这就像是在电话里编程,但它仍然能把事情做对!告诉它‘添加多线程’,嘭,完成了。独特的互斥锁,非常简洁。告诉它:‘给这个类添加多次撤销和重做功能’,这是我编程生涯中最简单的5分钟——我自己多次在自己的代码里添加和纠结撤销/重做功能。它写的代码结构非常好。相比之下,我感觉自己就像一只在泥里玩耍的邋遢鸭子。我意识到了几件事:当我不过度解释(代码解释)我认为结构或流程应该是怎样的时候,它给我的解决方案是最好的。相反,如果我让它做自己的事情并且假装我很笨,它会工作得更好;很多时候,它会自动添加我没有要求但最终会需要的东西,所以它不只是在预测标记,它还在预测我的下一个请求;不止一次,它选择了一个面向未来、开放式的解决方案,就好像它预计我们会进一步构建,后来当我想添加一些东西时,我很惊讶代码已经准备得如此充分;它对陌生代码的理解能力是我从未见过的。就把我的烂摊子扔给它就行;当我错了而它对了的时候,它没有迎合我的错误观点,而是向我解释我可能在哪里出错了,甚至指出我可能忽略的代码部分——这正是我出错的原因。当一个模型能够保持冷静而不是一直试图取悦我时,这很了不起。我之前用于编码的最佳模型是Google Gemini 2,但相比之下,它在处理严肃代码时感觉很困惑,创建了复杂且无法工作的混乱结构。我在前十分钟就觉得钱花得值了。接下来的30.98天?就当是bonus(额外奖励)了。我这么说是因为虽然我喜欢Llama,而且我深入研究本地LLM阶段,但这个(Claude)真的感觉像魔法。所以在我看来,有人把事情做对了。而且,它仍然是下一个标记预测器,这比它真的能读懂代码还要令人印象深刻。我现在最大的噩梦是:如果他们把它拿走……或者‘改进’它……
讨论总结
原帖作者讲述了使用Claude进行C++编码的惊艳体验,如高效完成复杂代码等。评论者们的讨论主要围绕Claude展开,一些人认可Claude在编码方面的卓越能力,认为它能理解用户需求、给出结构良好的代码、自动补充需求等;也有人对Claude的表现表示质疑,指出它存在价格昂贵、速率限制低、在特定任务中失败等劣势,还有人将Claude与其他模型如Gemini、GPT等进行比较,探讨不同模型在不同场景下的优劣。此外,也有部分评论与原帖内容的风格或营销性质有关。
主要观点
- 👍 Claude在编码方面表现惊人
- 支持理由:如能快速完成复杂代码、自动添加需求、理解用户需求等,有很多使用Claude进行编码有良好体验的评论者支持这一观点。
- 反对声音:有评论者认为Claude在代码生成方面表现不佳,存在诸如无搜索功能、会忘记对话内容等问题,还有人表示在自己的使用场景中Claude表现不好。
- 🔥 本地模型与商业模型存在差距
- 正方观点:认为本地模型在编码方面落后顶尖商业模型约一年,商业模型如Claude在问题和代码理解上有很大优势。
- 反方观点:有评论者希望有用于代码编写的优质本地语言模型,也有人认为本地模型可处理小任务,Claude处理严肃工作更好,不同工具各有差异,并非本地模型完全不如商业模型。
- 💡 不同模型在不同编程语言中的表现各异
- 解释:例如有评论者指出在Golang、Python和C#上,GPT o1、Claude 3.5、Sonnet和Deepseek v3质量无差异,但仅在React语言方面,Claude有明显优势;还有人提到Claude在C++上表现好与C++有大量训练数据有关,在Rust方面表现不突出,在套接字编程和汇编等底层编程方面表现良好。
金句与有趣评论
- “😂 you do better marketing than Anthropic does, lol”
- 亮点:以一种诙谐的方式调侃原帖作者对Claude的夸赞像是营销行为。
- “🤔 yeah lol there’s a reason Claude’s got a cult following”
- 亮点:指出Claude有一批追随者是有原因的,侧面反映出Claude有其独特之处。
- “👀 One of these is not true unless you are writing control software for a nuclear plant or something similar — or trying to center a div using CSS.”
- 亮点:对原帖作者声称用25年C++经验在三天内完成原本需要数月的工作表示质疑,是一种理性的挑战。
情感分析
总体情感倾向较为复杂。部分评论者对Claude在编码方面的能力表示高度认可和赞同,情感积极;也有评论者对Claude提出质疑,甚至持否定态度,认为它存在各种问题,如价格高、表现不佳等,情感偏消极。主要分歧点在于Claude是否真的如原帖所说在编码方面有那么强大的能力,以及与其他模型相比的优劣。可能的原因是不同评论者的使用场景、经验以及对模型的期望不同。
趋势与预测
- 新兴话题:模型在不同编程语言中的表现比较、模型与IDE的集成方式等可能会引发后续讨论。
- 潜在影响:如果Claude真的如部分人所说在编码方面有巨大优势,可能会对软件开发行业产生影响,改变开发人员的工作方式;同时,关于不同模型的优劣讨论也可能影响用户对模型的选择。
详细内容:
《Claude 模型在编程领域引发的热议》
在 Reddit 上,一篇关于 Claude 模型的讨论引起了广泛关注。原帖作者详细阐述了自己使用 Claude 进行 C++编程的经历,称赞其能力强大,短短几天就帮助完成了原本需要数月才能完成的任务。该帖子获得了众多点赞和大量评论。
讨论的焦点主要集中在以下几个方面:
- 对 Claude 编程能力的高度评价:有人表示 Claude 在理解和生成代码方面表现出色,特别是在处理复杂任务时,能提供高效且结构良好的代码。例如,有用户称在 Python 编程中,Claude 表现优秀。
- 与其他模型的比较:如与 Google Gemini 2 的对比,认为 Claude 在处理严肃代码时更具优势。同时,也有用户提到 DeepSeek R1、Qwen 等模型,并对它们的特点进行了讨论。
- 成本和使用限制:有人指出 Claude 价格较高,订阅有限制,且存在上下文长度的限制。
- 个性化体验:不同用户根据自身需求和使用场景,对 Claude 的评价有所差异。
有人分享道:“我切换到 Claude 将近一年了,在 Python 方面真的很好用。”还有用户说:“我测试了 Claude 和 Google AI Studio,在处理特定复杂问题时,Google AI Studio 表现更好。”
关于 Claude 的争议点在于其高昂的成本和使用限制,以及在某些特定语言或任务中的表现并非绝对领先。然而,讨论中的共识是 Claude 在编程领域确实展现出了强大的能力,为开发者提供了很大的帮助。
特别有见地的观点如:“我认为模型会逐渐变得更差,因为训练者存在沉没成本谬误。”这一观点丰富了对模型发展的思考。
总的来说,Reddit 上关于 Claude 的讨论充分展现了其在编程领域的优势和不足,以及用户对其的复杂态度。这也让我们对人工智能在编程领域的应用有了更全面的认识。
感谢您的耐心阅读!来选个表情,或者留个评论吧!