原贴链接

Llama2 70b发布的时候我被震撼到了。在我的M3 Max本地就能获取这么多知识，让我感觉很有力量。仅仅过了一年，DeepSeek R1就让Llama 2看起来像个小孩子。它的输出效果非常好，而且在仅40GB内存下吐token的速度也很快，这很疯狂。无法想象再过一年会发展成什么样。

讨论总结

原帖感叹从llama2到DeepSeek R1在短短一年间发展迅速，DeepSeek R1让llama2相形见绌。评论者们的讨论涉及多个方面，包括对Llama系列不同版本的评价，对DeepSeek R1在性能、创意写作、编程、自托管等多方面的评价，还有人分享了自己的使用体验、学习经历、对人工智能发展速度的惊叹，也有人对原帖提到的时间等细节提出疑问，整体氛围积极活跃，大家各抒己见。

主要观点

👍 llama2 70b发布时令人惊艳
- 支持理由：原帖作者表示在自己的M3 Max上运行时感受到它带来的知识力量。
- 反对声音：有评论者直言llama 2很糟糕。
🔥 DeepSeek R1相比Llama 3.3 70B性能更优
- 正方观点：多位评论者在比较中发现R1表现更好，如在创意写作、找bug和代码补全方面等。
- 反方观点：有评论者认为除了编码、逻辑和数学方面，R1 70b GGUF不如Qwen 2.5 72b。
💡 开源模型取得非凡进步，是很棒的资源
- 解释：从llama2到DeepSeek R1的发展展现出开源模型的飞速发展，这种发展成果对大众有益。
👍 DeepSeek R1在推理和创意写作方面表现出色
- 支持理由：有评论者测试后发现其在推理谜题和创意写作测试中表现惊艳。
- 反对声音：无明显反对声音。
💡 DeepSeek R1给人感觉像是智能PC助手而非仅高级文本生成器
- 解释：有评论者在特定PC上运行时感受到它更像是智能助手。

金句与有趣评论

“😂 Not gonna lie, I thought llama 2 was dog shit even at the time, but llama 3 onwards got my attention”
- 亮点：与原帖对llama 2的高度评价形成鲜明对比，表达出不同的观点。
“🤔 R1 is not bullshitting the benchmarks. It’s the first open model that’s able to solve a Caesar cipher with a shift greater than 5.”
- 亮点：从具体的能力方面体现出R1的优秀之处。
“👀 This is the ChatGPT moment for open - source models.”
- 亮点：将DeepSeek R1的出现对开源模型的意义类比为ChatGPT对闭源模型的意义，形象地表达出其重要性。
“😂 I know I will be extremely unpopular, but besides coding, logic and math R1 70b GGUF is not really better than my old complex prompt on Qwen 2.5 72b. A bit of a letdown.”
- 亮点：在大家普遍对R1评价较好的情况下，提出不同看法，且表达得很直白。
“🤔 For me, this is truly the first model, that I can run locally on normal PC (ok, dual 3090s is not normal BFU PC, but still..), and it feels like an "intelligent" PC assisstant than just a an advanced text generator.”
- 亮点：结合自身使用场景，描述出DeepSeek R1的独特优势。

情感分析

总体情感倾向是积极的。主要分歧点在于对Llama 2的评价以及DeepSeek R1在某些特定场景或与其他模型比较时的性能。可能的原因是大家使用模型的场景、需求以及对不同版本的体验不同。例如一些人在更早期接触到Llama 2，当时可能存在各种不足而觉得它不好；对于DeepSeek R1，不同人在不同的任务场景下（如编码、创意写作等）使用，会得出不同的比较结果。

趋势与预测

新兴话题：开源模型是否会对OpenAI等闭源模型造成冲击，以及未来普通消费者能否运行类似规模的模型。
潜在影响：如果开源模型持续发展并对闭源模型造成冲击，可能会改变人工智能市场的格局，更多的资源可能会流向开源领域，促使闭源模型提高竞争力或者调整商业模式；对于普通消费者来说，如果能够运行大规模模型，可能会改变人们获取信息、进行创作等的方式。

详细内容：

《从 Llama 2 到 DeepSeek R1：开源模型的惊人进展》

最近，Reddit 上有一个关于模型发展的热门讨论引起了大家的关注。帖子“From llama2 –> DeepSeek R1 things have gone a long way in a 1 year”获得了众多点赞和大量评论。帖子主要探讨了从 Llama 2 到 DeepSeek R1 的巨大进步，感叹短短一年多的时间里模型性能的快速提升，并对未来的发展充满期待。

讨论的焦点主要集中在对不同模型性能的评价和个人使用体验上。有人认为 Llama 2 当时表现不佳，Llama 3 之后才引起关注；也有人指出 DeepSeek R1 在很多方面表现出色，比如解决恺撒密码、网页设计、找代码漏洞等，甚至比 Claude 3.5 和 o1 还要好。

有用户分享道：“作为一名技术爱好者，我从 Llama 2 出现时就开始关注。每次回来都有新的更好的模型。这技术的发展速度让人惊叹，对我来说这就是个有趣的爱好。”

还有用户说：“我用 DeepSeek R1 做 Python 相关的工作，从昨天开始用，印象非常深刻。”

但也有不同声音，比如有用户表示：“我知道我这么说可能不受欢迎，但除了编码、逻辑和数学，R1 70b GGUF 并不比我在 Qwen 2.5 72b 上的旧复杂提示好多少，有点让人失望。”

同时，关于模型的运行速度、资源消耗、适用场景等方面也存在争议。比如有人提到 DeepSeek R1 的思考过程消耗大量令牌，资源利用方面存在问题。

讨论中也有一些共识，大家普遍认为开源模型的进步是巨大的，为人们提供了更多选择和可能性。

总的来说，这次关于模型的讨论展现了技术发展的迅速和多样性，也让我们对未来的发展充满期待。不知道未来还会有怎样令人惊喜的突破！

讨论总结#

主要观点#

金句与有趣评论#

情感分析#

趋势与预测#

详细内容：#