原贴链接

他们的新许可很糟糕。在这种情况下,或许还不如使用Llama,还有那没有公开权重的3B(模型)呢?情况肯定已经发生了变化,我们正处于人工智能时代的开端,先例很重要。我希望有一天我们能够自己预训练一个不错的20B模型(分布式训练在当前10B模型的训练中显示出了一些希望)。

讨论总结

整个讨论围绕Mistral的新许可证展开。原帖作者表达对Mistral新许可证不满,认为还不如用llama。评论者们从不同角度发表看法,包括Mistral公司作为小公司的盈利需求、模型训练成本、开源的价值、商业策略的合理性等,大家各抒己见,有理解也有反驳。

主要观点

  1. 👍 Mistral是小公司,需要以某种方式盈利
    • 支持理由:与OpenAI等巨头相比,Mistral规模小,需要资金维持运营,如评论者提到OpenAI都尚未盈利,Mistral - Large在很多任务中表现最佳但也需盈利。
    • 反对声音:无。
  2. 🔥 对于新模型只要不用于商业用途就可以使用
    • 正方观点:这符合多数商业行业的运作模式,有llama可用已经是成果,小公司需要盈利才能生存。
    • 反方观点:原帖作者认为Mistral新许可证糟糕,这种做法不合理。
  3. 💡 付费权重即将到来,免费模型像是商业版本的诱饵
    • 解释:有人认为免费模型是为商业版本做铺垫,商业版有更多限制,这是封闭许可证的特点,Mistral商业许可证价格昂贵不值得。
  4. 💡 预训练20B模型需要大型GPU集群和高额资金投入
    • 解释:训练模型成本高昂,若无足够资源难以实现预训练20B模型,混合许可模式对公司来说更可行。
  5. 💡 Mistral存在指令问题,指令调整相对较差
    • 解释:其采用的模板仅适用于核心基础内容,如今多数人基于指令调整进行训练,Mistral的指令调整已不可行。

金句与有趣评论

  1. “😂 I hope there will come a time where we could pretrain a good 20B model ourselves”
    • 亮点:表达了对能够自己预训练大模型的期望。
  2. “🤔 It seems kinda stupid that everyone has to start from scratch with every model release, especially when the architecture isn’t changing much anyway.”
    • 亮点:指出每次模型发布都从头开始不太合理的现象。
  3. “👀 Oh it definitely going to that direction… I mean I love Mistral, I really do, but this sharp change in attitude… it stings.”
    • 亮点:表达了对Mistral态度转变的失望,虽然喜爱但难以接受新的变化。
  4. “😂 You sound super entitled.”
    • 亮点:直接反驳原帖作者,用词较为犀利。
  5. “🤔 Mistral is great, and Mistral - Large still is the best model for a lot of tasks.”
    • 亮点:肯定了Mistral的价值,从性能方面给予认可。

情感分析

总体情感倾向较为复杂,既有对Mistral新许可证不满的负面情绪,也有理解Mistral作为小公司需要盈利的正面态度。主要分歧点在于Mistral新许可证的合理性以及其对使用者的影响。可能的原因是不同的立场和利益出发点,如一些使用者希望有更多的免费使用权限,而从Mistral公司角度需要考虑盈利。

趋势与预测

  • 新兴话题:随着分布式训练的发展,社区预训练更大模型(如20B模型)的可能性。
  • 潜在影响:如果更多公司采取类似Mistral的商业策略,可能会对开源社区以及AI爱好者的模型使用和研究产生影响,推动社区探索更多应对模型垄断的方法,也可能影响未来模型开发和盈利模式的走向。

详细内容:

标题:关于 Mistral 新许可证的热门讨论

近日,Reddit 上一篇关于 Mistral 新许可证的帖子引发了广泛关注。该帖子称其新许可证不尽人意,获得了众多点赞和大量评论。讨论主要围绕着 Mistral 新许可证带来的影响、与其他模型的比较以及行业发展趋势等方向展开。

讨论焦点与观点分析: 有人认为新许可证很糟糕,还不如使用 llama 或其他没有开放权重的模型。比如有人说:“新许可证让人失望,在这个 AI 时代开端,先例很重要,希望有一天我们能自己预训练一个好的 20B 模型。” 也有人觉得可以对现有预训练模型应用新技术,部分原因是出于骄傲,对于 Mistral 这样的公司来说,如果使用其他公司的模型可能会显得不好。 还有人指出,架构未变但训练技术在变,这反映在深层权重上。有人提到像微软发布 wizardlm 时的情况,以及英伟达在使用其他模型作为实验起点方面的做法。也有人认为付费权重是趋势,还有人表示像 Mistral 这样的小公司需要通过某种方式盈利。 有人分享道:“Gemini 8B 没有权重,Mistral 3B 也没有权重,我很伤心。” 有人则认为像 llama 这样的存在已经是很大的突破,应按照规则使用新模型。 一些用户探讨了 Mistral 新许可证的具体限制和规定,比如有人提到从快速浏览来看,MRL-0.1 许可证只允许非商业用途。

总之,关于 Mistral 新许可证的讨论十分热烈,观点多样,反映了大家对 AI 模型发展和商业模式的关注与思考。