原贴链接

提供了Skywork - R1V模型的GitHub链接:https://github.com/SkyworkAI/Skywork - R1V

讨论总结

此讨论围绕新的开源推理模型Skywork - R1V展开。评论者从不同角度进行了讨论,包括将其与其他模型进行基准测试对比、对模型本身能力的评价、该模型所属公司的过往成果、模型是否与中国有关的地域讨论以及模型在ollama上的运行情况等,大部分评论对该模型持有积极或期待的态度。

主要观点

  1. 👍 Skywork - R1V模型与QwQ预览版比较时有优势
    • 支持理由:评论者Chromix_指出对比结果
    • 反对声音:无
  2. 🔥 与完整的QwQ相比,在AIME 2024中Skywork - R1V分数低于QwQ
    • 正方观点:Chromix_提供AIME 2024分数对比
    • 反方观点:无
  3. 💡 Skywork - R1V仅公布了部分基准测试结果,需要更多测试来全面了解该模型
    • 解释:Chromix_认为目前公布结果有限,长文本基准测试是一个有趣方向
  4. 💡 模型看起来不错,文本处理能力很酷,视觉基准在70b级别看起来很酷
    • 解释:Beneficial - Good660从视觉和文本能力方面给出正面评价
  5. 💡 认为Skywork - R1V会很出色,期待除Qwen - Max外,有一个可用的开源MoE
    • 解释:某评论者基于该公司之前成果做出的期待

金句与有趣评论

  1. “😂 They compared against QwQ preview and beat it.”
    • 亮点:直接表明Skywork - R1V与QwQ预览版对比的优势
  2. “🤔 For the recently released full QwQ it’s the other way around though.”
    • 亮点:转折指出与完整QwQ对比时Skywork - R1V的劣势
  3. “👀 It looks nice.”
    • 亮点:简单直接地表达对模型的正面感受
  4. “😂 More than 3/4 of singapore’s population is ethnically Chinese. "almost" seems accurate.”
    • 亮点:对地域关联表述争议的一种解释
  5. “🤔 They say the GGUF support will be released "very soon".”
    • 亮点:提供了关于Skywork - R1V的软件支持方面的期待信息

情感分析

总体情感倾向为正面,大部分评论者对Skywork - R1V模型表达了肯定、期待等积极态度。主要分歧点在于模型的地域关联表述上,“几乎”这个表述引发了点赞和点踩的争议,原因是部分人认为表述不准确,而另一部分人认为新加坡华裔人口众多所以该表述合理。

趋势与预测

  • 新兴话题:模型在ollama上的运行情况以及GGUF支持的发布可能会引发更多技术层面的讨论。
  • 潜在影响:如果Skywork - R1V模型性能优秀,可能会对人工智能开源模型领域产生推动作用,促使更多类似模型的开发或者改进现有的模型评估标准。

详细内容:

标题:新开源推理模型 Skywork-R1V 引发 Reddit 热议

最近,Reddit 上一个关于新开源推理模型 Skywork-R1V 的帖子引起了众多关注。该帖子不仅提供了模型的链接https://github.com/SkyworkAI/Skywork-R1V,还引发了热烈的讨论,收获了大量的点赞和众多评论。

讨论的焦点主要集中在以下几个方面:

有人指出,Skywork-R1V 与 QwQ 预览版相比有优势,但在 QwQ 正式发布后则处于劣势。比如在 AIME 2024 中,QwQ 得分 79.5,而 Skywork 为 72.0。在视觉方面,其 MathVista 和 MMMU 分数与新的 Mistral Small 3.1 模型大致处于同一范围。不过,他们只公布了少数精选的基准测试结果,还需要更多测试以获得更全面的了解,像长上下文基准测试就会很有意义。

有用户表示,这是一个多模态模型,显然是 deepseek-ai/DeepSeek-R1-Distill-Qwen-32B 和 OpenGVLab/InternViT-6B-448px-V2_5 的合并。

还有人认为,模型看起来不错,文本能力很酷,视觉基准测试在 70b 级别看起来也不错,但这个模型是 38b。

也有人提到,该公司过去还制作过一个 138B 的 MoE,从 13B 初始化。

关于该模型所属的地区,有人问是不是中国的,有回答称差不多是,因为新加坡超过四分之三的人口是华裔。

还有用户关心能否在 ollama 上运行该模型,有人称 GGUF 支持将“很快”发布。

在这场讨论中,大家对于模型的性能、特点以及应用场景等方面存在不同的看法。有人对其表现充满期待,认为这可能会带来巨大的影响;也有人对其目前公布的测试结果表示不太满意,希望能有更多更全面的测试数据。

总之,关于 Skywork-R1V 模型的讨论还在继续,相信随着更多信息的披露和测试结果的公布,大家对它会有更深入的认识。