原贴链接

在查看翻译API的成本时,我被价格惊到了。Azure每百万字符10美元,Google是20美元,DeepL为25美元。为了对实时翻译用例进行粗略估算,我假设说话速度为每分钟150个单词,每个单词翻译3次(因为随着语境变长文本会被多次重新翻译)。这样算下来成本如下:Azure每小时1.62美元;Google每小时3.24美元;DeepL每小时4.05美元。假设同样的数字,gemini - 2.0 - flash - lite每小时成本不到0.01美元。成本因提示长度而异,但实际上我得到的是每小时略低于0.005美元。这比DeepL便宜800多倍,仅为其成本的0.1%。想必翻译质量会稍差一些,但差多少呢?这种劣势会持续多久呢?如果能便宜99%,我能接受一定程度的质量下降,而且似乎很容易预见,在不久的将来,大语言模型将超越传统翻译模型的质量。目前,准确性在很大程度上取决于提示。我需要进行更多评估,但到目前为止,在我的测试中,我发现我得到的翻译大多数时候和Google的一样好(大部分时间相同)甚至更好。我有信心通过更好的提示达到Google准确率的90%。如果能降低99.9%的成本,我可以接受90%的准确率。对很多人来说,90%的准确率无法满足他们的翻译需求,他们愿意为最好的服务支付高价。但随着基于大语言模型的解决方案不断改进,传统翻译API的高成本将变得越来越不合理,我们将看到以前因成本过高而无法实现的翻译方式得以实现。

讨论总结

原帖指出LLMs用于翻译比DeepL等传统翻译方式成本低很多,评论者们围绕这个话题展开了多方面的讨论。包括分享不同翻译模型(如gemma 3、Mistral、Gemini等)在不同语言(如塞尔维亚语、罗马尼亚语、日语等)翻译中的表现、各自的优势与不足,还有人提到翻译模型在特定需求(如设备端翻译、长文档翻译等)下的情况,以及翻译中除成本外其他因素(如人工质检、翻译准确性、语境理解等)的重要性。

主要观点

  1. 👍 LLMs翻译成本远低于DeepL等传统翻译方式
    • 支持理由:原帖通过计算不同翻译API的成本,得出gemini - 2.0 - flash - lite用于翻译比DeepL便宜800倍的结论;多个评论者表示惊讶或认可LLMs的成本优势。
    • 反对声音:有评论者指出DeepL在一定的翻译字符量范围内更便宜且可靠。
  2. 🔥 不同的翻译模型适用于不同的语言和场景
    • 正方观点:如有人认为对于塞尔维亚语Mistral是当前最好的翻译模型;有人在罗马尼亚语的翻译上推荐command - R+通过huggingchat使用效果较好;还有人分享自己使用Gemma模型进行不同需求的翻译很有用。
    • 反方观点:无明显反方观点,主要是补充不同的适用情况。
  3. 💡 LLMs在翻译方面存在一些问题
    • 解释:有评论者指出LLMs会频繁产生幻觉或者省略内容;LLMs可能会忽略提示语;在非英语语言翻译方面存在能力存疑或口译表现不好的情况。
  4. 💡 除成本外,翻译中还有其他重要因素
    • 解释:如人工质检在机器翻译中的重要性;在翻译中语境理解的重要性;以及像DeepL在翻译含图表和图像的技术文档时能保持文档结构的独特卖点。
  5. 💡 LLMs在翻译上有独特优势
    • 解释:LLMs能利用全文做语境处理长翻译依赖关系;可通过提供上下文提高翻译准确性;LLMs翻译可与DeepL相媲美甚至更优。

金句与有趣评论

  1. “😂 I just finished finetuning gemma 3 12b for translation with unsloth, and I can tell you it is better than Google Translate 100% of the time.”
    • 亮点:直接表明gemma 3 12b经微调后在翻译上比谷歌翻译更好,数据比较绝对,吸引眼球。
  2. “🤔 我发现情况相反,即LLM翻译往往比像谷歌翻译(未过多使用DeepL)这样的专用服务听起来更“自然”。”
    • 亮点:提出与原帖可能暗示的LLM翻译质量可能更差相反的观点,强调LLM翻译的自然性。
  3. “👀 at $25 per million characters the cost for machine translation doesn’t matter. what matters is the manual QA that must be done on these million characters.”
    • 亮点:从不同角度看待机器翻译成本,强调人工质检环节的重要性,打破常规认知。
  4. “😂 Maybe, that’s their USP.”
    • 亮点:简洁地指出DeepL保持文档结构可能是其独特卖点,语言简洁有力。
  5. “🤔 There is often no one single best translation for a concept.”
    • 亮点:对翻译的本质提出思考,指出概念可能不存在单一最佳翻译,深化了对翻译的理解。

情感分析

总体情感倾向较为理性客观。主要分歧点在于LLMs和传统翻译模型(如DeepL、谷歌翻译等)谁更优,原因包括对不同语言的适用性、翻译准确性、成本、是否考虑语境等多方面因素的权衡。例如,有些评论者强调LLMs成本低且翻译效果好,而另一些则指出LLMs存在幻觉、忽略提示语等问题,或者强调传统翻译模型在某些情况下(如特定语言、保持文档结构等)的优势。

趋势与预测

  • 新兴话题:创建通用翻译器的可行性;LLMs的扩展性;如何在翻译中更好地控制质量和定义(如批量翻译)。
  • 潜在影响:如果LLMs在翻译上不断改进,可能会对传统翻译服务(如DeepL、谷歌翻译等)的市场份额产生冲击;也可能促使翻译行业更加关注除成本外的其他因素(如人工质检、语境理解等)的提升。

详细内容:

标题:LLMs 在翻译成本上大幅低于 DeepL,引发热烈讨论

在 Reddit 上,一篇关于翻译成本对比的帖子引起了广泛关注。原帖指出,在翻译 API 的成本方面,Azure 为每百万字符 10 美元,Google 为 20 美元,DeepL 为 25 美元。通过一系列假设和计算,得出 gemini-2.0-flash-lite 的翻译成本每小时不到 0.01 美元,远低于 DeepL,甚至不足其成本的 0.1%。这一对比引发了众多关于翻译质量、适用性以及未来发展趋势的讨论。

在讨论焦点与观点分析方面,有人认为 LLM 翻译听起来更自然,比如 [songdoremi] 表示 LLM 翻译比 Google Translate 等服务更自然,因为更能考虑上下文。但也有人提出不同意见,像 [mrjackspade] 认为 LLM 有时会编造内容。对于不同语言对的翻译效果,大家看法不一。例如,[Actual-Lecture-1556] 认为在特定语言对如罗马尼亚 - 英语的翻译中,CommandR+ 表现出色,甚至优于 DeepL。

不少用户分享了个人经历和案例。[Sadeghi85] 通过多种方式创建数据集并进行微调,还对比了不同模型的效果。有人则表示在某些语言上,特定模型如 Mistral 表现较好。

关于 LLM 翻译的质量和优势,[ikergarcia1996] 认为 LLM 翻译不会更差,反而由于训练数据更多、参数更多以及能利用全文语境,在很多情况下表现更优。但也有人如 [Nuenki] 指出在某些情况下 LLM 翻译也有不足。

总之,这次关于翻译成本和质量的讨论展示了大家对 LLM 翻译的不同看法和丰富经验,也让我们对这一领域的未来发展充满期待。