模型与技术

DeepSeek R1 671B在2个M2 Ultra上运行比读取速度还快

[围绕DeepSeek R1 671B在2个M2 Ultras上运行比读取速度快展开讨论，涉及价格、性能比较、硬件设备相关的多方面观点，有对未来发展的期待和对部分硬件厂商的不满等情绪]

[围绕Block新发布的Goose开源AI代理展开讨论，包括使用体验、功能、对不同系统的支持以及与其他项目的比较等，整体氛围积极探索]

[RWKV - 7“Goose” 🪿 1.5B发布引发讨论，包括对其喜爱与期待、模型特性探讨、未看到发布信息的人分享资源链接，也有负面评价]

[原帖介绍Deepseek 2.5相关情况，评论主要围绕Deepseek 2.5的性能、量化、流行度、硬件运行情况以及产品评价等展开讨论，整体氛围较为理性]

[围绕模型质量评估及o3是否是重大进步展开讨论，涉及成本、OpenAI的炒作嫌疑、o3的实际表现等多方面观点，氛围既有赞同也有质疑]

[原帖展示将DeepSeek R1 671B MoE动态量化到1.58bits的GGUF格式成果，评论者主要表达惊叹、认可，也提出疑问、分享测试结果，还涉及硬件配置与模型运行机制等内容，整体氛围积极且充满技术交流探讨。]

[DeepSeek发布Janus - Pro - 7B统一多模态模型引发众多讨论，涉及模型本身特性、许可证、运行相关、对各方影响以及与其他事物的关联等多方面内容，讨论氛围热烈且观点多样]

[Qwen新推出SOTA多模态模型引发讨论，涵盖模型性能、开源情况、与其他模型对比、运行方式、中国AI发展等多方面内容，讨论氛围积极且充满探索性]

[原帖作者取消OpenAI Plus订阅转用本地运行DeepSeek - R1 14b引发讨论，包括本地运行模型的各方面情况、不同模型的比较、对原帖作者行为的质疑以及与OpenAI的对比等，讨论氛围较热烈且观点多样]

[帖子围绕Qwen3.0 MOE是否为新推理模型展开讨论，包含对Qwen模型的各种推测、不同版本差异、相关模型的期待与评价，同时夹杂一些其他话题如春节、股票投资等，讨论氛围较为多元且存在部分争议]