原贴链接

暂停片刻，阅读《我现在可以在笔记本电脑上运行GPT - 4级别的模型》。能在消费级硬件上运行的较小模型超越更大、更旧的模型只需要20个月。是的，对于互联网用户来说这感觉像是永恒，但1.5年对于人类寿命来说很短。不相信我吗？Llama 1已经快2岁了！（2023年2月24日发布）在接下来的20个月内，将会有比R1更好的小模型。就像有耐心的游戏玩家省钱等待Steam促销一样，我们通过等待更好、更高效的小模型来省钱。

讨论总结

原帖认为如果承担不起R1本地运行的成本，耐心等待是最好的选择，因为小模型发展迅速，未来20个月内可能会有比R1更好的小模型。评论者们的观点各不相同，有的认同原帖，认为AI发展速度快，等待小模型发展是省钱的好办法；有的则持反对意见，提出了不同的解决方案，如购买Mac mini来运行32b或70b版本，或者现在投入资金购置设备以便将来运行更大的模型。还有人对原帖中关于小模型发展趋势的假设提出质疑，认为这种趋势不会无限持续下去，因为模型训练不足等原因。

主要观点

👍 如果承担不起成本，就只能耐心等待，这是唯一的办法。
- 支持理由：AI发展速度快，未来小模型能力可能提高。
- 反对声音：如认为现在投入20,000元购置设备，将来就能运行更大的模型。
🔥 小模型永远无法达到R1的性能。
- 正方观点：小模型参数有限，能容纳的信息量有限。
- 反方观点：存在文献表明小模型在一定条件下（如实现CoT）能超水平发挥。
💡 原帖的推测基于当前趋势，但这种趋势是否持续无法保证。
- 虽然我们可以保持乐观，但实际上只有时间能证明是否会如原帖所说在未来20个月内有比R1更好的小模型出现。
💡 大多数人不需要R1，蒸馏模型已经足够好。
- 对于一般需求来说，R1并非必要，蒸馏模型可满足需求。
- 无明显反对观点。
💡 Mistral Small 3 (24B)是一个变革者，其性能可与Llama 3.3 70B相媲美。
- 有具体的网址作为来源依据。
- 无明显反对观点。

金句与有趣评论

“😂 Gamer save money on buying 2000 games they will never launch * ; )”
- 亮点：以游戏玩家购买游戏但不玩的现象类比人们不必急于使用R1，幽默诙谐。
“🤔 实际上我认为最大的问题是他们有足够的资源来训练新模型并坚持开源。”
- 亮点：从模型开发资源与开源的角度对原帖进行补充思考。
“👀 那是对的，但是也将会有一个新的Deepseek R3，与你能在本地运行的模型相比，它将会超级棒。”
- 亮点：在原帖等待小型模型发展的基础上补充新的发展元素。
“😂 I can run R1:32b faster on my M1 Mac than my PC with RTX3060 12GB, i5 - 9600K, 4TB Nvme SSD, and 48 GB RAM.”
- 亮点：通过具体配置比较运行速度，提供实际案例。
“🤔 小模型是永远不会像R1那样运行的。”
- 亮点：明确表达小模型与R1在性能上的差距，引发后续讨论。

情感分析

总体情感倾向较为理性中立。主要分歧点在于是否认同原帖提出的等待小模型发展的观点，以及小模型是否能够达到R1的性能。原因是大家从不同的角度看待模型的发展，如成本、性能、发展速度、训练资源等方面。

趋势与预测

新兴话题：可能会有更多关于不同硬件设备运行模型的比较，以及小模型在特定条件下性能提升的研究。
潜在影响：对人工智能模型的研发方向和消费者的选择有一定影响，如果小模型能够快速发展并满足需求，可能会改变市场格局，影响大模型的发展策略。

详细内容：

标题：关于能否在本地运行 R1 模型的热门讨论

在 Reddit 上，有一个题为“If you can’t afford to run R1 locally, then being patient is your best action.”的帖子引发了广泛关注。该帖子指出，只需等待 20 个月，能在消费级硬件上运行的较小模型就可能超越较大的旧模型，并提供了链接I can now run a GPT-4 class model on my laptop。此贴获得了众多点赞和大量评论，主要讨论方向包括模型蒸馏效果、技术发展趋势、硬件需求等。

在讨论中，观点多样。有人认为，如果承担不起成本就别无他法，且多数人实际上并不需要，模型蒸馏的效果也还不错。例如，有人说“32B Qwen 蒸馏模型是第一个我测试过能在本地使用而不会立刻搞砸一切的模型，每天能节省 5 美元。”但也有人觉得蒸馏模型不好，比如“蒸馏模型抓不住文本中的模式，除了浪费令牌，啥也干不了。”

还有人分享了个人经历，像[Brandu33]称与 OLLAMA 的 14B 模型交流，对解决技术问题有帮助。[Townsiti5689]则表示喜欢 Confucius 模型，能在 24GB 内存的电脑上快速运行。

关于未来趋势，有人认为这只是基于当前趋势的推测，不能保证会持续，也有人坚信技术进步会继续，例如[Pyros - SD - Models]表示“没有任何技术在短短 7 年就能完全优化，我们还处于研究的早期阶段。”但也有人反驳，如[uwilllovethis]以互联网泡沫为例，指出观点存在漏洞。

有人认为 llama 70b 不是 GPT - 4 级别，任何量化都会降低能力。但也有人认为量化模型能在现代 MacBook Pro 上运行良好。

总之，关于能否在本地运行 R1 模型以及相关技术的发展，Reddit 上的讨论充满了多样性和复杂性，各方观点激烈碰撞，让人们对这一话题有了更深入的思考。

讨论总结#

主要观点#

金句与有趣评论#

情感分析#

趋势与预测#

详细内容：#