模型与技术 新模型发布

亚洲研究人员新成果:YuE全曲生成开源模型

[围绕亚洲研究者的YuE音乐模型开源项目展开讨论,涉及项目成果、许可证、硬件需求等,有期待赞赏也有怀疑否定,氛围多元]

 ·  · 
模型与技术 新模型发布

中国发布Qwen2.5 - Max模型

[围绕Qwen2.5 - Max模型展开讨论,涉及与其他模型对比、开源与否、性能表现、规模大小等多方面内容,讨论氛围较理性且多元。]

 ·  · 
模型与技术 新模型发布

Block发布名为Goose的新开源AI智能体,功能超编码

[围绕Block新发布的Goose开源AI代理展开讨论,包括使用体验、功能、对不同系统的支持以及与其他项目的比较等,整体氛围积极探索]

 ·  · 
模型与技术 新模型发布

RWKV - 7 "Goose" 1.5B版本发布

[RWKV - 7“Goose” 🪿 1.5B发布引发讨论,包括对其喜爱与期待、模型特性探讨、未看到发布信息的人分享资源链接,也有负面评价]

 ·  · 
模型与技术 新模型发布

1.58bit DeepSeek R1 - 131GB Dynamic GGUF

[原帖展示将DeepSeek R1 671B MoE动态量化到1.58bits的GGUF格式成果,评论者主要表达惊叹、认可,也提出疑问、分享测试结果,还涉及硬件配置与模型运行机制等内容,整体氛围积极且充满技术交流探讨。]

 ·  · 
模型与技术 新模型发布

DeepSeek发布deepseek - ai/Janus - Pro - 7B(统一多模态模型)

[DeepSeek发布Janus - Pro - 7B统一多模态模型引发众多讨论,涉及模型本身特性、许可证、运行相关、对各方影响以及与其他事物的关联等多方面内容,讨论氛围热烈且观点多样]

 ·  · 
模型与技术 新模型发布

Qwen发布新的SOTA多模态模型,权重开源,可与Claude Sonnet和GPT - 4o竞争

[Qwen新推出SOTA多模态模型引发讨论,涵盖模型性能、开源情况、与其他模型对比、运行方式、中国AI发展等多方面内容,讨论氛围积极且充满探索性]

 ·  · 
模型与技术 新模型发布

取消OpenAI Plus订阅,转用本地DeepSeek - R1 14b

[原帖作者取消OpenAI Plus订阅转用本地运行DeepSeek - R1 14b引发讨论,包括本地运行模型的各方面情况、不同模型的比较、对原帖作者行为的质疑以及与OpenAI的对比等,讨论氛围较热烈且观点多样]

 ·  · 
模型与技术 新模型发布

文三.0混合专家模型?新推理模型?

[帖子围绕Qwen3.0 MOE是否为新推理模型展开讨论,包含对Qwen模型的各种推测、不同版本差异、相关模型的期待与评价,同时夹杂一些其他话题如春节、股票投资等,讨论氛围较为多元且存在部分争议]

 ·  · 
模型与技术 新模型发布

新模型与GPT2模型大小相同,令人惊叹

[原帖提及某模型与旧gpt2模型相同大小引发讨论,评论主要围绕R1模型、基准测试、不同模型比较、运行疑问等展开,讨论氛围理性且多为探讨性]

 ·  ·