原贴链接

Deepseek非常热门。我知道它成本降低了95 - 97%。但究竟是怎么做到的呢?除了更便宜的训练(不进行人类反馈强化学习)、量化和缓存(我猜是语义输入的HTTP缓存?)之外,成本降低还来自哪里呢?不可能只有这些原因,因为据说R1没有被量化,对吧?是有补贴吗?还是OpenAI/Anthropic收费太高了?到底是怎么回事?

讨论总结

整个讨论围绕Deepseek价格低廉的原因展开。大家从不同角度进行分析,包括技术层面的架构特点、量化、缓存,市场层面的定价策略、竞争需求,地域因素如中国的成本优势、可能存在的政府补贴等。讨论中既有理性的分析,也存在一些质疑和带有偏见的观点,总体氛围热烈且争议较大。

主要观点

  1. 👍 Deepseek成本低是多种因素共同作用的结果
    • 支持理由:许多评论提到如架构上的MoE、MLA、FP8等,还有中国的廉价电力、人力成本低等多种因素共同影响。
    • 反对声音:部分人怀疑是否存在这么多因素共同作用,认为可能存在隐瞒真实成本或者欺骗行为。
  2. 🔥 OpenAI/Anthropic可能收费过高
    • 正方观点:有其他提供商以较低价格提供类似服务且盈利,Deepseek价格相比之下低很多,所以存在这种可能性。
    • 反方观点:OpenAI处于巨额亏损状态,其固定成本和每个用户的成本都很高,可能是收费过低而非过高。
  3. 💡 Deepseek可能采用亏本出售策略获取市场份额
    • 解释:以低于成本的价格提供产品以获得市场份额,这种做法在该领域不罕见,而且Deepseek除新闻稿外无其他营销就走向世界。
  4. 🤔 中国的成本优势有助于Deepseek低价运营
    • 解释:包括廉价的电力、人力成本,以及可能存在的政府补贴等,从宏观成本角度解释Deepseek的低价。
  5. 😕 Deepseek宣称的成本低廉可能是一种误导,真实成本未知
    • 解释:有人认为人们并不知道其真实成本,其开源且API使用成本大幅降低相当于免费,可能打乱市场格局,但背后真实成本可能被掩盖。

金句与有趣评论

  1. “😂 Is OpenAI/Anthropic just…charging too much?”
    • 亮点:直接提出对OpenAI/Anthropic收费过高的疑问,引发众多关于不同公司定价策略的讨论。
  2. “🤔 The first few architectural points compound together for huge savings: MoE, MLA, FP8, MTP, Caching”
    • 亮点:从架构角度阐述Deepseek成本降低的原因,为技术分析提供了方向。
  3. “👀 Deepseek mentioned they priced earlier versions to make a small profit. Anthropic and OpenAI can charge a premium given that they have the best performing models.”
    • 亮点:对比不同公司的定价和盈利模式,有助于理解市场上的价格差异。
  4. “😎 OpenAI/Anthropic overcharge (Gemini Flash cheap as fuck??) + DS takes on loss to grow users + MoE architecture + cheap hosting/electricity + a fair bit of downplaying the actual cost (not like anybody can come and verify).”
    • 亮点:全面概括了多种可能导致Deepseek成本低的因素,包括对其他公司过度收费的质疑。
  5. “🤨 The $5.576 million figure for training DeepSeek’s R1 model is misleading for several key reasons”
    • 亮点:对Deepseek R1模型训练成本数据提出质疑,引发对成本真实性的讨论。

情感分析

总体情感倾向较为复杂,既有理性探讨的中立态度,也有部分带有偏见的负面态度。主要分歧点在于对Deepseek成本低的原因看法不一,有人认为是正常的市场和技术因素导致,而有人怀疑是不正当手段如欺骗、政府补贴等。可能的原因是不同的人站在不同的立场(如地域、商业竞争等)看待这个问题,并且缺乏足够的信息来确切判断Deepseek成本低的真正原因。

趋势与预测

  • 新兴话题:可能会进一步探讨Deepseek成本低是否会对整个AI市场格局产生重大影响,如更多公司是否会调整定价策略或者寻求类似的成本控制方法。
  • 潜在影响:如果Deepseek真的以低成本提供高质量服务,可能会促使其他公司提高效率、降低成本,也可能会改变市场竞争格局,让更多的中小公司有机会参与竞争;对消费者而言可能会享受到更低价、更优质的AI服务。

详细内容:

标题:Reddit 热议 DeepSeek 成本之谜

Reddit 上一则关于“DeepSeek 为何如此便宜”的帖子引发了广泛关注。原帖指出,DeepSeek 号称能实现 95%-97%的成本削减,但其具体原因引发了众多讨论。该帖子获得了大量的点赞和众多评论。

讨论的焦点主要集中在 DeepSeek 成本降低的各种可能性。有人认为是其采用的诸如 MoE(混合专家)、FP8 等创新架构和技术,以及高效的训练方法,如以强化学习为主的训练策略,降低了数据标注和训练成本。也有人猜测可能是中国政府的补贴、低价的劳动力、电费成本优势等因素。还有观点认为其可能是作为一种“损失领导者”策略,先以低价占领市场,或者存在故意压低成本数据以获取竞争优势的可能。

例如,有用户分享道:“DeepSeek 采用的 MoE 架构大大减少了计算量,其多令牌预测机制能提高输出效率。” 但也有用户表示怀疑:“OpenAI 等公司一直致力于高端模型研发,投入巨大,DeepSeek 如此低价令人难以置信,或许存在数据造假。”

这场讨论中的共识在于,DeepSeek 的低价策略确实对整个 AI 市场产生了重大冲击,促使其他公司重新审视自身的成本和定价策略。然而,对于其真正的成本构成和低价原因,仍存在诸多争议和不确定性。

值得注意的是,部分观点带有一定的偏见和片面性。我们需要客观看待这些讨论,深入探究 DeepSeek 成本背后的真相,以及其对全球 AI 发展的长远影响。