Meta 显然全力投入开放模型,推出了优秀的 Llama 3,并加倍投入 Llama 3.1,甚至开放了 405B 版本,两个月前许多人还对此表示怀疑。
Mistral 刚刚发布了他们最新的旗舰模型 Mistral Large 2 供下载,尽管他们之前的旗舰模型并未提供下载。几天前他们还推出了 NeMo,这是 13B 尺寸类别中最强大的模型。
在发布了几个表现不佳的开放模型之后,谷歌给了我们令人惊叹的 Gemma 2 模型,这两个模型都是同类最佳(尽管 Gemma 2 9B 和 Llama 3.1 8B 之间的比较还有待观察,我想)。
微软继续在自由软件许可下发布高质量的小型模型,而 Yi-34B 最近从自定义的限制性许可转变为宽松的 Apache 许可。
其他供应商如 Nvidia 和 Apple 的开放发布似乎也比过去明显增多。
这与 2023 年末的情况形成了鲜明对比,当时看起来行业即将从开放发布转向。人们当时说类似“Mixtral 8x7b 可能是我们能得到的最好的开放模型”之类的话,而今天,与最近发布的更小的模型相比,那个模型看起来就像垃圾。
OpenAI 似乎致力于其“每年一个模型”的发布周期(忽略较小的发布如 Turbo 和 GPT-4o mini)。如果是这样,他们的日子已经不多了。Anthropic 今年晚些时候仍有 Claude 3.5 Opus 在筹备中,如果它能兑现 Sonnet 的承诺,它可能会在发布时成为最佳模型。所有其他仅封闭的供应商已经被开放模型甩在了后面。
讨论总结
当前AI行业正经历一场由封闭转向开放模型的重大变革。Meta、Mistral、Google、Microsoft等公司纷纷发布高质量的开放模型,这些模型的发布不仅数量众多,而且质量上乘,显示出技术的快速发展。讨论中涉及了开放模型的优势、硬件限制、多模态模型的期待、许可协议的开放性、以及模型在不同领域的应用。同时,用户对不同模型的偏好和市场定位也成为了讨论的焦点。这一趋势不仅改变了行业的竞争格局,也引发了关于未来技术进步和商业模式的深入思考。
主要观点
- 👍 Meta全力投入开放模型
- 支持理由:发布了Llama 3及其改进版本,显示了公司在开放模型领域的决心和实力。
- 反对声音:Meta在隐私方面可能存在问题,但技术革新方面表现突出。
- 🔥 Mistral从API-only转向开放模型下载
- 正方观点:这是一个明显的策略变化,显示了对开放模型的重视。
- 反方观点:Mistral的开放模型可能会引发更多的法律诉讼。
- 💡 Google和Microsoft也在逐步开放其模型的使用权
- 解释:这些公司的行动表明,开放模型已成为行业趋势,可能会改变AI行业的商业模式。
- 👀 硬件限制,特别是GPU的VRAM限制,是当前的主要问题
- 解释:GPU制造商利用VRAM作为定价策略,限制了大型模型的普及。
- 🌟 多模态模型的期待
- 解释:用户希望看到更多能够生成图像和音频的多模态模型,以及更开放的许可协议。
金句与有趣评论
- “😂 I’m incredibly grateful to the companies and those who work at them that push for creating open models.”
- 亮点:表达了对推动开放模型的公司和员工的深深感激。
- “🤔 Here’s my guess as to why: Lots and lots of free testing.”
- 亮点:提出了开放模型大量发布的原因之一是免费测试。
- “👀 The recent flurry of open-weight model releases is amazing to watch.”
- 亮点:对近期开放模型的大量发布表示赞赏。
情感分析
讨论的总体情感倾向是积极的,大多数评论者对开放模型的快速发展和行业转向表示乐观。然而,也有一些担忧,特别是关于硬件限制和未来技术进步的放缓。争议点主要集中在开放模型对版权法的影响、商业模式的改变以及模型在不同领域的应用效果。
趋势与预测
- 新兴话题:多模态模型的开发和应用可能会成为未来讨论的热点。
- 潜在影响:开放模型的增加可能会改变AI行业的商业模式,推动更多公司采用开放源代码和更灵活的许可协议。
感谢您的耐心阅读!来选个表情,或者留个评论吧!