随着最新一轮的发布，行业似乎正在转向开放模式

Meta 显然全力投入开放模型，推出了优秀的 Llama 3，并加倍投入 Llama 3.1，甚至开放了 405B 版本，两个月前许多人还对此表示怀疑。

Mistral 刚刚发布了他们最新的旗舰模型 Mistral Large 2 供下载，尽管他们之前的旗舰模型并未提供下载。几天前他们还推出了 NeMo，这是 13B 尺寸类别中最强大的模型。

在发布了几个表现不佳的开放模型之后，谷歌给了我们令人惊叹的 Gemma 2 模型，这两个模型都是同类最佳（尽管 Gemma 2 9B 和 Llama 3.1 8B 之间的比较还有待观察，我想）。

微软继续在自由软件许可下发布高质量的小型模型，而 Yi-34B 最近从自定义的限制性许可转变为宽松的 Apache 许可。

其他供应商如 Nvidia 和 Apple 的开放发布似乎也比过去明显增多。

这与 2023 年末的情况形成了鲜明对比，当时看起来行业即将从开放发布转向。人们当时说类似“Mixtral 8x7b 可能是我们能得到的最好的开放模型”之类的话，而今天，与最近发布的更小的模型相比，那个模型看起来就像垃圾。

OpenAI 似乎致力于其“每年一个模型”的发布周期（忽略较小的发布如 Turbo 和 GPT-4o mini）。如果是这样，他们的日子已经不多了。Anthropic 今年晚些时候仍有 Claude 3.5 Opus 在筹备中，如果它能兑现 Sonnet 的承诺，它可能会在发布时成为最佳模型。所有其他仅封闭的供应商已经被开放模型甩在了后面。

讨论总结

当前AI行业正经历一场由封闭转向开放模型的重大变革。Meta、Mistral、Google、Microsoft等公司纷纷发布高质量的开放模型，这些模型的发布不仅数量众多，而且质量上乘，显示出技术的快速发展。讨论中涉及了开放模型的优势、硬件限制、多模态模型的期待、许可协议的开放性、以及模型在不同领域的应用。同时，用户对不同模型的偏好和市场定位也成为了讨论的焦点。这一趋势不仅改变了行业的竞争格局，也引发了关于未来技术进步和商业模式的深入思考。

主要观点

👍 Meta全力投入开放模型
- 支持理由：发布了Llama 3及其改进版本，显示了公司在开放模型领域的决心和实力。
- 反对声音：Meta在隐私方面可能存在问题，但技术革新方面表现突出。
🔥 Mistral从API-only转向开放模型下载
- 正方观点：这是一个明显的策略变化，显示了对开放模型的重视。
- 反方观点：Mistral的开放模型可能会引发更多的法律诉讼。
💡 Google和Microsoft也在逐步开放其模型的使用权
- 解释：这些公司的行动表明，开放模型已成为行业趋势，可能会改变AI行业的商业模式。
👀 硬件限制，特别是GPU的VRAM限制，是当前的主要问题
- 解释：GPU制造商利用VRAM作为定价策略，限制了大型模型的普及。
🌟 多模态模型的期待
- 解释：用户希望看到更多能够生成图像和音频的多模态模型，以及更开放的许可协议。

金句与有趣评论

“😂 I’m incredibly grateful to the companies and those who work at them that push for creating open models.”
- 亮点：表达了对推动开放模型的公司和员工的深深感激。
“🤔 Here’s my guess as to why: Lots and lots of free testing.”
- 亮点：提出了开放模型大量发布的原因之一是免费测试。
“👀 The recent flurry of open-weight model releases is amazing to watch.”
- 亮点：对近期开放模型的大量发布表示赞赏。

情感分析

讨论的总体情感倾向是积极的，大多数评论者对开放模型的快速发展和行业转向表示乐观。然而，也有一些担忧，特别是关于硬件限制和未来技术进步的放缓。争议点主要集中在开放模型对版权法的影响、商业模式的改变以及模型在不同领域的应用效果。

趋势与预测

新兴话题：多模态模型的开发和应用可能会成为未来讨论的热点。
潜在影响：开放模型的增加可能会改变AI行业的商业模式，推动更多公司采用开放源代码和更灵活的许可协议。

讨论总结#

主要观点#

金句与有趣评论#

情感分析#

趋势与预测#

讨论总结

主要观点

金句与有趣评论

情感分析

趋势与预测