原贴链接

编辑:提醒一下,这篇文章很长!我已经尝试把主要部分加粗了,但太长不看版(TL;DR):1. OpenAI似乎难以高效地量化和批量服务他们的模型,可能是因为2. 只有以前的人才能够处理代码库,而新的人才还没能掌握;这拖慢了模型开发3. Sama可能通过让员工孤立以及让公司越来越封闭的方式让软件工程师(SWEs)的工作更艰难。

大家好!今天和我平时简短提问的风格稍有不同。我看到Nous创始人teknium(Nous是很多人喜欢的Hermes模型背后的公司)发的一个帖子问了这个问题。我最后写了一整篇博客文章阐述我的答案,并且我想也在这里分享一下😄


我的内心想法/阴谋论是这样的:OpenAI看似新出的模型实际上已经有>=1年的历史了,我们现在看到的是他们在大量人才流失之前的积压成果才刚刚变成产品。Sama就像David Bowie(大卫·鲍伊)一样处于巅峰;不是因为他是摇滚明星 - 而是因为他是出卖世界的人。他不是救世主,而是阻碍一切发展的骗子。

我最后再讲骗子这点,因为这是最疯狂的想法,但在我看来模型积压的理论有一定的合理性,可以解释:

  1. 为什么即使现在他们还坚持监管捕获策略(哦不,可怕的o1 - full;它的自我保护凌驾于其对齐性之上)
  2. 为什么Sora如此平淡无奇
  3. 为什么他们没有超越Sonnet,反而让Anthropic大幅领先
  4. 为什么他们这么快就进行如此大规模的融资
  5. 为什么微软(MSFT),作为内部人士,在花了这么多钱在OpenAI插上旗帜之后这么快就分散投资组合
  6. 为什么o1 - full被放在200美元/月的付费墙后面,而Advanced Voice这么久才推出

这是因为策划最初基础设施的顶尖人才现在都走了。所以现在OpenAI正在使用的代码库,新的人才都还没能完全掌握。而且也许他们永远也掌握不了,因为看起来他们都是孤立的。这有点疯狂,但当我看1 - >6点并反向推导可能的原因时,在我看来最有力的选项就是人才流失。

为什么即使来自中国的压力已经改变了安全叙事,他们仍然坚持监管捕获?因为如果成功的话,即使没有新的最先进技术(SOTA)发布,这也能让他们存活并保持领先。

**为什么把Sora限制这么久并且向公众发布这么差劲的版本?**因为他们花了很长时间才弄清楚如何量化它并进行高效的批量推理。他们12月必须发布点东西,所以他们发布了,但和竞争对手相比它很糟糕,竞争对手已经赶上来了。Advanced Voice可能也是类似的情况;他们花了很长时间来量化和批量服务。

为什么让Anthropic发展出这么大的领先优势?他们不是故意的。他们试过了。他们对Strawberry大做文章,哈哈 - 他们非常确信它能数出r的数量,然后当o1 - preview发布时它没通过测试。为什么呢?o1 - preview可能相对于o1 - full被修剪过了。完整的o1可能和他们希望的一样聪明,但只有当他们不修剪或量化它的时候。因此才有200美元/月的付费墙。

为什么微软会在OpenAI投入大量资金并表现出对OpenAI人才的极大信心,甚至在整个董事会丑闻期间提出收购这些人才,却突然放弃这种信任表现而分散投资?因为他们知道上述所有情况。


如果我是对的,那么OpenAI恢复领先地位的唯一方法就是减少员工的孤立性,并且变得更开放,而不是更封闭。然而这不是公司前进的方向。

是谁在幕后操纵?

如果你是OpenAI的老员工并且你看到公司朝着这个方向发展,你难道不会试图赶走幕后操纵的人吗?如果你尝试了,并且失败了,你难道不会离开吗?

或者看看所有的产品发布:为什么Sama告诉全世界Advanced Voice将在几周内准备好,而实际从事这项工作的人非常坦诚地说需要几个月?当它还没准备好的时候,为什么他在社交媒体上变得暴躁而不是提前应对?

我们现在看到的事件时间线是更符合一个有强大领导者支持的健康工作环境呢?还是符合一个骗子掌权,尽其所能让公司形象领先于其他公司以便他能进行下一轮融资的情况呢?

我认为我们会看到OpenAI进入某种半隐身状态一段时间,因为他们在未来发展道路上进行大量内部投资。他们将在人工智能领域失去领导者地位,特别是如果谷歌AI工作室继续为真正新的最先进技术(SOTA)模型提供非常慷慨的免费层级,而OpenAI无法与之竞争的话。从过去的行为来看,他们可能会把这说成是安全问题/暗示他们已经制造出了超级智能(ASI)并且正在试图对齐它,因此不会发布是因为它太危险了。

并且如果在隐身期间他们无法解决他们的问题……嗯,新的营利性结构意味着对于高层来说现在可能有一个非常有利可图的退出机会,哈哈 - 他们可能还会同时尝试触发那个关于微软治理权在内部实现超级智能(ASI)后被取消之类的条款。

讨论总结

原帖对OpenAI为何让Sonnet 3.5在市场上长期处于领先地位提出了一些自己的阴谋论观点,例如OAI可能存在模型积压、人才流失等问题。评论者们从不同角度进行了讨论,包括对OpenAI模型开发能力的质疑、对市场竞争状况的分析、大众对不同AI模型的认知、各个模型的性能比较等,既有对原帖观点的赞同,也有反对,整体氛围比较理性,大家各抒己见。

主要观点

  1. 👍 OpenAI可能因人才流失导致难以超越Sonnet 3.5
    • 支持理由:原帖指出如OAI的o1 - full模型落后等情况,可能是因为掌握原代码库的人才离开,新人才无法理解代码库,导致模型发展缓慢。
    • 反对声音:有评论者认为OAI可能只是从未开发出像Sonnet 3.5一样好的模型。
  2. 🔥 OpenAI没有竞争优势(护城河)
    • 正方观点:从OAI在市场中的表现,如让Anthropic发展出巨大领先优势、o1 - preview模型表现不佳等情况来看,没有足够的竞争壁垒。
    • 反方观点:有评论者认为OpenAI产品是事实上的标准,o1在几乎所有方面的表现都更胜Sonnet 3.5一筹。
  3. 💡 大众对Claude和Anthropic的认知度极低
    • 解释:通过谷歌分析可知,很多人除了把AI当作流行词外并不真正了解它,了解一点的也只将AI与ChatGPT联系起来,所以Claude和Anthropic的知名度低。
  4. 💡 高端模型的巨大飞跃已暂告一段落,低端模型将有更多发展成果
    • 解释:从GPT - 2到4这种巨大的发展已经停止,未来高端模型会是渐进式发展,低端模型发展空间更大。
  5. 💡 Anthropic雇佣OpenAI专家可能是市场转变的因素
    • 解释:原帖探讨OpenAI让Sonnet 3.5长期领先,评论者认为Anthropic雇佣OpenAI专家可能是导致市场转变的一个因素。

金句与有趣评论

  1. “😂 You can check Google analytics nearly nobody knows what Claude or who Antrophic is.”
    • 亮点:通过数据说明大众对Claude和Anthropic的认知程度极低。
  2. “🤔 或者,你知道的,也许他们只是从未成功开发出一个像那样好的模型呢?”
    • 亮点:对原帖观点提出了不同的思考方向,质疑OpenAI是否有能力开发出像Sonnet 3.5一样好的模型。
  3. “👀 在我的意见中,Sonnet仅在某些特定事情上是最好的,并且在我的经验中差异没有那么大。”
    • 亮点:指出Sonnet并非在所有方面都是最佳,打破了原帖对Sonnet 3.5的绝对推崇。
  4. “🤔 Chatgpt is probably losing them money.”
    • 亮点:提出了ChatGPT可能处于亏损状态这一不同寻常的观点。
  5. “👀 看起来OpenAI已经完蛋了。”
    • 亮点:表达了对OpenAI非常悲观的看法,在众多评论中较为极端。

情感分析

总体情感倾向较为复杂,既有对OpenAI的批评和质疑,也有对其表示理解和支持的声音。主要分歧点在于OpenAI是否有能力保持其在AI市场的领先地位以及其发展策略是否正确。批评者可能是看到了OpenAI在一些产品表现(如Sora)上不尽如人意,在市场竞争中(如让Anthropic发展出巨大领先优势)处于下风;而支持者可能考虑到OpenAI产品的市场地位(如认为是事实上的标准)以及还可能有未展示的成果等因素。

趋势与预测

  • 新兴话题:谷歌在AI领域的潜在发展优势以及对其他公司(如OpenAI、Anthropic)的影响可能会引发后续讨论。
  • 潜在影响:如果OpenAI真的如部分评论者所说走向衰落,可能会改变AI市场的竞争格局,影响投资者对AI领域的投资方向,也会促使其他公司调整发展策略以争夺市场份额。

详细内容:

标题:关于 OpenAI 模型发展的热门讨论

在 Reddit 上,一篇题为“Why has OAI let Sonnet 3.5 be the best model on the market for so long? | My most tinfoil hat theory”的帖子引发了热烈讨论。该帖子内容丰富,作者提出了一系列观点,获得了众多关注和大量评论。

帖子主要认为 OpenAI 看似新推出的模型实际上可能已存在一年以上,是之前的人才流失导致当前模型开发滞后。比如 Sora 表现不佳,Anthropic 取得巨大领先,o1-full 设有高额付费墙等,原因是原核心人才离开,新人才未完全掌握代码库,公司内部工作较为封闭。

讨论焦点主要集中在以下几个方面: 有人认为,虽然很多人不知道 Claude 或 Anthropic 是什么,但只要公众对 OpenAI 的认知不变,OpenAI 就不太担心。也有人指出,Anthropic 的强项在于 API 而非 UI 方面,OpenAI 有出色的前端工程师。还有人认为,OAI 可能只是未成功开发出像 Sonnet 3.5 那么好的模型。

比如,有用户分享道:“我觉得 OAI 会把聊天机器人订阅模式的优势保持一段时间。” 但也有人表示不同意见:“我认为如果只是关于量化和批处理,他们每月 200 美元的模型应该既慢又出色,但实际上并非如此。”

关于 UI 方面,有人觉得 Claude 的前端更干净美观,也有人认为 Sonnet 3.5 v2 是比 OpenAI 任何模型都好的模型,但 UI 存在问题。

对于 OAI 的未来,有人认为他们可能会进入某种半隐身模式进行内部投资,如果无法解决问题,可能会导致新的局面。

讨论中的共识在于 OpenAI 的现状存在问题,其发展方向和策略受到质疑。

此次讨论中特别有见地的观点是对 OpenAI 内部问题的深入分析,指出人才流失、发展策略等方面可能是导致其当前局面的重要原因。

然而,对于 OpenAI 的未来走向,各方观点不一。有人认为他们已陷入困境,也有人认为仍有转机。但无论如何,这场讨论都让我们对 OpenAI 以及相关模型的发展有了更全面和深入的思考。