深度探索Deepseek v3 0324:国内的Sonnet 3.5
[原帖讨论Deepseek v3 0324模型的能力并与Claude 3.5 Sonnet比较,评论围绕模型运行的硬件、成本、性能、推理能力等多方面展开,氛围较理性且有不同观点交流]
[原帖讨论Deepseek v3 0324模型的能力并与Claude 3.5 Sonnet比较,评论围绕模型运行的硬件、成本、性能、推理能力等多方面展开,氛围较理性且有不同观点交流]
[关于DeepSeek - V3在消费级硬件(如M3 Ultra)上运行的话题,大家从模型性能、速度、硬件相关等多方面进行讨论,存在不同观点且争议较大,整体氛围理性且技术向]
[关于Google发布TxGemma用于治疗应用的开放模型,有对其性能的期待、对模型相关的疑惑、责任的疑问、也有表示认可和积极态度的,整体讨论氛围多元。]
[原帖作者收到新设备,评论围绕设备能运行的Deepseek相关模型展开,包括模型测试、性能指标、基准测试等内容,整体氛围积极且充满技术探讨]
[对Ling系列模型的讨论涉及性能、制作方式、比较合理性等多方面,有提问、质疑、建议等不同观点,整体氛围理性客观]
[原帖提到Chonkie库在GitHub消失、网站下线,评论中有人提供资源获取方式、猜测消失原因并给出替代方案和解决工作使用中的相关问题等]
[关于荷兰有很多3090 FE在售,大家从价格、性价比、散热、噪音、市场等多方面展开讨论,氛围比较理性客观]
[围绕Jensen Huang与GPU相关的视频展开讨论,涉及英伟达商业策略、GPU的多方面内容、企业贪婪等,有不同的观点和多样的情感倾向。]
[这是一个关于DeepSeek - V3 - 0324不同量化版本的讨论,多数人对发布者的工作表示赞同和感谢,其中2.71位量化版本受到较多关注,也有一些人在交流相关技术问题]
[原帖是关于RigoChat 2论文中llama.cpp量化对质量退化影响的研究,评论者们从量化性能、模型可用性、评判标准等方面展开讨论,有不同的观点碰撞,整体氛围较理性]