模型与技术 性能对比

DeepSeek R1 671B在2个M2 Ultra上运行比读取速度还快

[围绕DeepSeek R1 671B在2个M2 Ultras上运行比读取速度快展开讨论,涉及价格、性能比较、硬件设备相关的多方面观点,有对未来发展的期待和对部分硬件厂商的不满等情绪]

 ·  · 
模型与技术 新模型发布

Block发布名为Goose的新开源AI智能体,功能超编码

[围绕Block新发布的Goose开源AI代理展开讨论,包括使用体验、功能、对不同系统的支持以及与其他项目的比较等,整体氛围积极探索]

 ·  · 
模型与技术 新模型发布

RWKV - 7 "Goose" 1.5B版本发布

[RWKV - 7“Goose” 🪿 1.5B发布引发讨论,包括对其喜爱与期待、模型特性探讨、未看到发布信息的人分享资源链接,也有负面评价]

 ·  · 
模型与技术 模型更新

深度探索Deepseek 2.5(及Unsloth)

[原帖介绍Deepseek 2.5相关情况,评论主要围绕Deepseek 2.5的性能、量化、流行度、硬件运行情况以及产品评价等展开讨论,整体氛围较为理性]

 ·  · 
模型与技术 性能对比

模型基准能否良好指示模型质量?o3是否为重大进步?

[围绕模型质量评估及o3是否是重大进步展开讨论,涉及成本、OpenAI的炒作嫌疑、o3的实际表现等多方面观点,氛围既有赞同也有质疑]

 ·  · 
模型与技术 新模型发布

1.58bit DeepSeek R1 - 131GB Dynamic GGUF

[原帖展示将DeepSeek R1 671B MoE动态量化到1.58bits的GGUF格式成果,评论者主要表达惊叹、认可,也提出疑问、分享测试结果,还涉及硬件配置与模型运行机制等内容,整体氛围积极且充满技术交流探讨。]

 ·  · 
模型与技术 新模型发布

DeepSeek发布deepseek - ai/Janus - Pro - 7B(统一多模态模型)

[DeepSeek发布Janus - Pro - 7B统一多模态模型引发众多讨论,涉及模型本身特性、许可证、运行相关、对各方影响以及与其他事物的关联等多方面内容,讨论氛围热烈且观点多样]

 ·  · 
模型与技术 新模型发布

Qwen发布新的SOTA多模态模型,权重开源,可与Claude Sonnet和GPT - 4o竞争

[Qwen新推出SOTA多模态模型引发讨论,涵盖模型性能、开源情况、与其他模型对比、运行方式、中国AI发展等多方面内容,讨论氛围积极且充满探索性]

 ·  · 
模型与技术 新模型发布

取消OpenAI Plus订阅,转用本地DeepSeek - R1 14b

[原帖作者取消OpenAI Plus订阅转用本地运行DeepSeek - R1 14b引发讨论,包括本地运行模型的各方面情况、不同模型的比较、对原帖作者行为的质疑以及与OpenAI的对比等,讨论氛围较热烈且观点多样]

 ·  · 
模型与技术 新模型发布

文三.0混合专家模型?新推理模型?

[帖子围绕Qwen3.0 MOE是否为新推理模型展开讨论,包含对Qwen模型的各种推测、不同版本差异、相关模型的期待与评价,同时夹杂一些其他话题如春节、股票投资等,讨论氛围较为多元且存在部分争议]

 ·  ·