原贴链接

讨论总结

该讨论围绕o1和r1是否为像“纯”大型语言模型（LLMs）展开。众多评论者从不同角度进行分析，包括模型架构、训练方法、与其他模型对比等。在讨论中Gary Marcus的观点被多次提及且争议较大，部分评论者对他持否定态度，认为他不读论文或不懂论文等。同时还有一些有趣的类比观点，以及关于LLM概念、定义和发展方向等方面的讨论。

主要观点

👍 r1架构上是纯解码器的MoE模型，与其他类似模型相似。
- 支持理由：从相关论文研究得出。
- 反对声音：无。
🔥 Gary Marcus存在不读论文或读不懂论文的问题。
- 正方观点：他的一些言论表明他没有依据论文内容。
- 反方观点：无。
💡 o1和r1是纯LLMs。
- 支持理由：从模型本质和架构角度判断。
- 反对声音：部分人认为存在非纯的因素。
💡 对LLM进行强化学习不会改变其为LLM的本质。
- 支持理由：从LLM的基本定义出发。
- 反对声音：有人认为强化学习后不符合传统定义。
💡 o1比4o更纯的LLM，因为o1不是全模态的。
- 支持理由：以模态特性为依据。
- 反对声音：未提及。

金句与有趣评论

“😂 Bird_ee: That is such a stupid take.”
- 亮点：直接表达对不同观点的不屑态度。
“🤔 FullstackSensei: By that logic, a human trained as an engineer should not be considered human anymore, but rather a new species…”
- 亮点：通过独特的类比来探讨模型本质问题。
“👀 Do not take Gary seriously.”
- 亮点：简洁地表达对Gary Marcus的否定态度。
“😂 Juanesjuan: Everybody knows that Gary Marcus is always wrong”
- 亮点：非常笃定地否定Gary Marcus。
“🤔 TechnoAcc: Here is Gary Marcus finally admitting he is either 1. Too lazy to read a paper 2. Too dump to understand a paper”
- 亮点：尖锐地指出Gary Marcus的问题。

情感分析

总体情感倾向较为复杂。在对o1和r1是否为“纯”LLMs的判断上存在分歧，部分人持肯定态度，部分人持否定态度。对于Gary Marcus则大多是负面态度，主要分歧点在于对模型的判断标准以及对人物专业度的看法。可能的原因是大家从不同的专业背景、研究角度出发，同时也受个人对不同人物的既有印象影响。

趋势与预测

新兴话题：LLM与AGI的关系可能会引发后续讨论，如o1 - 式推理模型成为AGI的可能性。
潜在影响：如果关于“纯”LLM概念的争议继续发展，可能会影响到对相关模型的分类、评估以及在不同领域应用的考量。

详细内容：

标题：Are o1 and r1 like models “pure” llms?

这篇帖子在 Reddit 上引发了热烈讨论，吸引了众多用户参与，评论数众多。帖子主要探讨了 o1 和 r1 这类模型是否属于“纯”LLM（大型语言模型）的问题。

讨论焦点与观点分析：

有人认为，从架构上看，r1 是纯解码器的 MoE 变压器，与其他 MoE 模型相似，训练方法上则采用了特殊的强化学习算法 GRPO。
- 例如：有用户分享道：“作为一名在相关领域研究多年的人，我深入了解到 r1 在架构上的特点，其与其他模型的相似性主要体现在某些关键部分。”
也有人指出，o1 等模型的思考部分可能存在“不对齐”，但生成结论的部分是“对齐”的，且不同模型在处理复杂任务时的表现和优势有所不同。
- 比如：“我在实际使用中发现，o1 在处理特定任务时的效果并不如预期，这可能与它的内部结构和训练方式有关。”
对于模型是否为“纯”LLM，存在多种观点。有人认为它们就是普通的大型语言模型，只是训练方式有所差异；也有人觉得它们在架构和功能上具有独特性，不能简单地归为“纯”LLM。
- 例如：“在我看来，不能单纯地根据某些表面特征来判断，而应综合考虑多个因素。”

讨论中的共识是大家都在努力探讨这些模型的本质和特点，但对于其确切分类仍存在争议。一些独特的观点如将模型与人类工程师进行类比，认为不能因训练方式改变就认为其本质改变，丰富了讨论的维度。

总的来说，关于 o1 和 r1 这类模型是否为“纯”LLM 的讨论尚无定论，各方观点都有其合理性和局限性，需要进一步的研究和实践来明确。

讨论总结#

主要观点#

金句与有趣评论#

情感分析#

趋势与预测#

详细内容：#