原贴链接

加利福尼亚大学伯克利分校的一个人工智能研究团队，由博士生潘佳怡（Jiayi Pan）带领，声称仅用30美元就重现了DeepSeek R1 - Zero的核心技术，展示了如何以低成本实现先进模型。根据潘佳怡在Nitter上所述，他们的团队在Countdown游戏中重现了DeepSeek R1 - Zero，这个拥有30亿参数的小语言模型通过强化学习发展出了自我验证和搜索能力。DeepSeek R1的成本优势看起来是真实的。对OpenAI来说不是好消息。

讨论总结

整个讨论围绕伯克利AI研究团队以30美元重现DeepSeek核心技术展开。讨论涵盖了多个方面，包括对该技术重现的惊叹、质疑，对成本的看法，对相关模型训练、技术比较、应用的讨论，还涉及到这一成果对OpenAI等公司的影响，以及技术发展中的开放知识转移、强化学习等问题，同时也有一些与主题相关度不高的幽默调侃和独特观点。

主要观点

👍 对伯克利团队以低成本重现技术感到印象深刻并期待代码应用
- 支持理由：认为这是小型模型在技术实现上的突破，看到代码和训练资源可用感到兴奋。
- 反对声音：无。
🔥 强化学习重新受到关注令人感到疯狂
- 正方观点：KriosXVII等认为这一事件让强化学习再次成为焦点是很意外的事情。
- 反方观点：无。
💡 开放知识转移非常重要
- 支持理由：如果DeepSeek没有发表论文，就不可能有此次重现，所以这是一种胜利。
- 反对声音：无。
👍 伯克利团队重现DeepSeek技术的成本低
- 支持理由：以DoorDash为对比突出30美元成本极低。
- 反对声音：无。
🔥 可利用大R1模型建立RL管道来生成微调模型的数据集
- 正方观点：理论上可行且有助于提升模型效果。
- 反方观点：无。

金句与有趣评论

“😂 I’d love to see it applied to LLaMa 3.1 405B, and see how well it can improve itself”
- 亮点：表达出对将该技术应用于特定模型的期待，显示出对模型自我改进能力探索的兴趣。
“🤔 Insane that RL is back”
- 亮点：简洁地表达出对强化学习重新受关注的惊讶。
“👀 This is why open knowledge transfer is important. If deepseek didn’t publish the paper, this wouldn’t be possible.”
- 亮点：强调了开放知识转移在此次技术重现中的关键意义。

情感分析

总体情感倾向是积极的，大多数人对伯克利AI研究团队以低成本重现DeepSeek核心技术表示认可、惊叹或期待。主要分歧点在于对技术重现的真实性、完整性以及影响程度的看法。例如有人认为这是标题党，团队只是在特定练习中实施强化学习，距离声称的重现技术还差很远；还有人对30美元成本表示怀疑等。这些分歧可能源于不同的技术理解、期望以及对相关技术背景的了解程度。

趋势与预测

新兴话题：如将R1的蒸馏过程应用于更小的混合专家模型结合动态量化的探索，这可能引发后续关于模型优化和成本降低方面更深入的讨论。
潜在影响：如果类似的低成本技术重现和优化不断出现，可能会对整个AI行业的成本结构产生影响，改变市场竞争格局，促使更多公司重新思考自己的技术研发和成本投入策略。

详细内容：

标题：伯克利团队以 30 美元重现 DeepSeek 核心技术引发 Reddit 热议

近日，Reddit 上一则关于伯克利大学 AI 研究团队声称以 30 美元重现 DeepSeek 核心技术的帖子引起了广泛关注。该帖子https://www.tomshardware.com/tech-industry/artificial-intelligence/ai-research-team-claims-to-reproduce-deepseek-core-technologies-for-usd30-relatively-small-r1-zero-model-has-remarkable-problem-solving-abilities 提到，由博士候选人 Jiayi Pan 领导的团队在 Countdown 游戏中重现了 DeepSeek R1-Zero，并展示了其小型语言模型通过强化学习发展出的自我验证和搜索能力。此帖获得了大量的点赞和众多评论，引发了关于成本、性能、技术创新以及行业影响等多方面的热烈讨论。

讨论焦点主要集中在以下几个方面：有人认为这种低成本实现令人印象深刻，比如[StevenSamAI]就表示看到小模型能如此运作，并且有相关的代码和训练资料非常好。但也有人[aurlivm]指出，实际训练成本可能远高于 30 美元，比如训练 LLaMA 3.1 405B 这样的密集模型，其 GPU 时间开销相比 DeepSeek V3/R1 要高很多。对于技术的应用和发展方向，[Few_Painter_5588]提出如果能利用大模型设置强化学习管道生成高质量数据集，就能微调模型，并简化小模型的思考逻辑。[emil2099]则认为小模型能自我改进意味着可以在大规模应用前先进行低成本的强化学习技术实验，同时也指出了构建更好的真相验证机制所面临的挑战。在观点的争议方面，[StyMaar]认为声称以 30 美元重现 DeepSeek 技术是一种误导，这只是在特定练习中实现了某种形式的强化学习，距离真正重现核心技术还有差距。但也有人认为这是研究上的重大突破。值得注意的是，讨论中也存在一些有趣或引发思考的观点。比如[TheFuture2001]幽默地问道：“30 美元？接下来是不是 29.99 美元？或者限时买一送一？”

总的来说，这次伯克利团队的成果在 Reddit 上引发了热烈而深入的讨论，各方观点纷呈，既有对技术创新的肯定，也有对实际应用和成本的质疑。这不仅反映了人们对 AI 领域发展的高度关注，也展现了该领域的复杂性和多样性。未来，随着更多研究的开展和技术的进步，这些讨论或许将对 AI 技术的发展方向产生重要影响。

讨论总结#

主要观点#

金句与有趣评论#

情感分析#

趋势与预测#

详细内容：#