原贴链接

帖子仅包含一个图片链接，无实质可翻译内容

讨论总结

这个讨论主要源于Google长时间未更新某事物（可能与r1有关），大家对其处于什么等级展开讨论。同时也涉及到AGI相关话题，如AGI的定义、AGI等级的预测等。评论者们各抒己见，从不同角度阐述观点，整体氛围是理性探讨相关技术话题。

主要观点

👍 LLM在幻觉问题解决之前处于新兴类别
- 支持理由：LLM存在可靠性不足、在某些领域有欠缺等问题。
- 反对声音：无。
🔥 AGI的讨论无意义
- 正方观点：大家对AGI定义无法达成一致。
- 反方观点：无。
💡 Google不需要过多更新
- 解释：未明确提及，但从评论者认为Google不必频繁更新相关内容可知。
💡 目前r1的等级大概为2，即将达到等级3
- 解释：评论者直接给出了r1的等级推测。
💡 在多数人类任务方面目前处于或低于2级水平
- 解释：从人类任务完成情况的角度对当前等级进行判断。

金句与有趣评论

“😂 Eggman8728：i would say still very firmly in the emerging category.”
- 亮点：明确表达LLM目前的类别状态。
“🤔 I love to go back to this table every now and then and compare to the moving goalposts of all other competitors.”
- 亮点：体现出通过对比来得出某些结论的方式。
“👀 nonlogin：What is the source of this image?”
- 亮点：简洁地表达对图片来源的疑问。

情感分析

[总体情感倾向较为中性客观，主要分歧点在于AGI是否有意义以及Google是否需要更新等方面，可能原因是大家对相关技术的发展现状、定义、评估标准等有着不同的理解]

趋势与预测

新兴话题：[依据Deepmind标准达到AGI 5级面临的各种问题可能会引发后续讨论]
潜在影响：[对人工智能技术发展方向、评估标准的制定以及公众对人工智能的认知可能产生影响]

详细内容：

标题：关于 Google 等级评定的热门讨论

在 Reddit 上，一则关于“Google 许久未更新，其全 r1 处于什么等级”的帖子引发了广泛关注。该帖子获得了众多的点赞和大量的评论。

主要的讨论方向集中在对 Google 等级的评估以及与其他模型的比较，同时探讨了幻觉问题对等级判定的影响。

文章将要探讨的核心问题是如何准确评估 Google 的等级以及幻觉问题在其中的关键作用。

在讨论中，有人认为它仍处于新兴类别，因为幻觉问题未解决，模型在某些方面不可靠且存在不足。但也有人表示完全不同意这一观点，认为幻觉问题在人类表达中同样存在，不能仅以此来评判。还有人觉得只要幻觉问题出现频率足够低，可能影响不大，能力提升能减少幻觉，而且当跨越原始的 LLM 方法时，可能会直接从 1 级跃升至 3 或 4 级。

有人指出人类也会产生幻觉，个人证词被视为最薄弱的证据形式。也有人认为人类能够基于记忆或借助工具验证自己所说的话，而 AI 只是在猜测，若要避免“幻觉”，需找到不让其猜测下一个词，而是从较小搜索空间或记忆中检索的方法。

有人认为对于大多数人类任务，目前处于或低于 2 级水平，还有人表示当前的 SOTA 模型在编码、写作等方面可能处于 2 - 3 级水平。有人觉得按照 Deepmind 的标准，年中可能达到 AGI 水平，也有人认为它与 ChatGPT 处于同一水平，在数学和编码方面表现出色，但在创意写作方面不确定。

讨论中的共识是对于 Google 等级的评估存在多种观点和不确定性。特别有见地的观点如认为评估应采用科学方法，检测幻觉程度以及给出真实、合理、客观答案的程度，丰富了讨论。

总之，这场关于 Google 等级的讨论展现了观点的多样性和复杂性，也反映了大家对人工智能发展的关注和思考。

讨论总结#

主要观点#

金句与有趣评论#

情感分析#

趋势与预测#

详细内容：#