原贴链接

自Mistral Large 2407以来的大多数发布(如Mistral small、Ministral、Qwen 2.5 72B、Qwen 2.5 3B)都有受限的许可。随着模型变得越来越好且运行成本越来越低,许可却变得越来越严格。我相信很快可能只有学术实验室才会发布模型(权重)。

讨论总结

原帖提到自Mistral Large 2407以来,很多模型开放权重的许可证更受限,可能导致只有学术实验室才会发布模型权重。评论者们主要围绕这个现象展开讨论,涉及公司盈利需求、模型许可证限制带来的影响(如对品牌形象的影响)以及对这种趋势的期望(如希望反转)等方面,讨论氛围较为理性且具有一定深度。

主要观点

  1. 👍 赞同原帖关于模型许可证越来越严格的观点
    • 支持理由:从Mistral不公开3B模型权重等现象能看出这种趋势。
    • 反对声音:无。
  2. 🔥 Mistral需要盈利才能存在,其许可证做法受商业需求影响
    • 正方观点:Mistral不是大型企业,不像Meta能为内部项目投入大量资金做AI并善意发布模型,所以需要盈利。
    • 反方观点:无。
  3. 💡 限制许可证会给品牌带来负面影响
    • 解释:模糊的使用许可可能导致公司法务建议全面封禁相关模型,进而影响人们使用其API模型。
  4. 💡 如果公司让发布内容可免费用于非商业用途或研究可被谅解
    • 解释:模型训练成本高且处于未知领域,不清楚如何收回成本,这种模式相对公平。
  5. 💡 希望其他实验室能以宽松许可发布最先进模型
    • 解释:IBM发布Granite 3.0模型且许可宽松是好的例子,希望其他实验室效仿。

金句与有趣评论

  1. “😂 我同意。我也认为Mistral不发布其最小的3B模型的权重对开源社区来说是一个不好的迹象。”
    • 亮点:直接表明对原帖关于Mistral 3B模型权重不公开对开源社区影响观点的认同。
  2. “🤔 Mistral need to make money or they will not exist.”
    • 亮点:简洁地指出Mistral的盈利需求决定其行为。
  3. “👀 我希望他们意识到这也会给品牌带来坏名声。”
    • 亮点:强调了许可证限制对品牌形象的负面影响。
  4. “💡 如果我们对所有本地Mistral模型进行封禁,那么有什么会让任何人想要与他们仅有的API大型模型做生意呢?”
    • 亮点:阐述了封禁本地模型对其API模型使用的连锁负面影响。
  5. “🌟 我愿意对这种事情上的公司有所谅解,如果他们至少让其发布内容免费用于非商业用途或研究。”
    • 亮点:提出一种对公司在许可证方面较为宽容的态度及条件。

情感分析

总体情感倾向是比较理性客观的。主要分歧点较少,大家基本都在从不同角度分析模型许可证受限的现象。可能的原因是这个话题比较专业且涉及到多方面的利益权衡,大家更多是基于事实和逻辑来发表看法。

趋势与预测

  • 新兴话题:IBM发布宽松许可的Granite 3.0模型可能成为后续大家希望其他实验室效仿的一个新趋势点。
  • 潜在影响:如果更多实验室效仿IBM发布宽松许可的模型,可能会促进开源社区的发展,同时也可能影响相关公司在商业盈利和品牌形象等方面的平衡。

详细内容:

标题:近期开源模型发布的许可限制问题引发热议

在 Reddit 上,一篇题为“Recent open weight releases have more restricted licences”的帖子引发了众多关注。该帖子指出,自 Mistral Large 2407 以来的大多数发布都存在许可限制,比如 Mistral small、Ministral、Qwen 2.5 72B、Qwen 2.5 3B 等模型。随着模型不断优化且运行成本降低,许可却变得越发严格。此帖获得了大量点赞和众多评论,主要的讨论方向围绕着开源模型许可限制的影响及应对策略。

有人表示同意帖子的观点,认为 Mistral 不发布其较小的 3B 模型的权重对开源社区是个不好的信号。有人说:“这是一种很大的反差,他们本可以保留两个模型,但却向开源发布了更大的那个。人们总会抱怨,毕竟公司是要赚钱的,即便他们喜欢开源。”也有人指出:“Mistral 需要赚钱才能生存。他们不像 Meta 那样的大公司,可以为了内部项目在 AI 上投入大量资金,并出于善意发布模型。”还有人说:“当然,我只是指出这正成为一种趋势。Mistral Large 2 与 MRL 搭配说得通,但 SLMs 权重与 MRL 搭配就说不通了,除非他们发布训练流程等。”有人提议:“让收入超过 x 的公司订阅。有一些许可证允许业余爱好者研究和公司尝试,如果用于商业用途且超过特定利润就需要付费。”有人认为:“开源并不意味着免费。保密可能是因为竞争优势小,竞争对手能迅速适应或把新东西融入自己的模型。Meta 没有同样的压力。他们的目标就像 Android 对苹果那样压制对手,然后像谷歌慢慢关闭 Android 一样,Meta 也可以介入并关闭其平台。对于 Mistral 来说,这是生存问题。”

有人希望这种趋势能够逆转。也有人愿意在现阶段对公司在这类事情上的做法表示一定的宽容,只要他们至少让其发布免费用于非商业用途/研究。有人说:“‘它是免费的,但制作它花了我们很多钱,所以如果你想出如何用它赚钱,请给我们一些分成’,目前来看似乎还算公平。”还有人提到,好消息是 IBM 最近发布的 Granite 3.0 模型具有宽松的许可,至少从基准测试来看,该模型看起来非常不错,希望这能促使其他实验室也以宽松许可发布其最先进的模型。

这场讨论反映出了大家对于开源模型许可限制趋势的关注和担忧,同时也展现了对于如何平衡模型开发成本与开源共享精神的思考。在这个充满未知和挑战的领域,如何找到可持续的发展模式,是各方需要共同探索的重要课题。