Posts

深度探索Deepseek v3 0324：国内的Sonnet 3.5

[原帖讨论Deepseek v3 0324模型的能力并与Claude 3.5 Sonnet比较，评论围绕模型运行的硬件、成本、性能、推理能力等多方面展开，氛围较理性且有不同观点交流]

[关于DeepSeek - V3在消费级硬件（如M3 Ultra）上运行的话题，大家从模型性能、速度、硬件相关等多方面进行讨论，存在不同观点且争议较大，整体氛围理性且技术向]

[关于Google发布TxGemma用于治疗应用的开放模型，有对其性能的期待、对模型相关的疑惑、责任的疑问、也有表示认可和积极态度的，整体讨论氛围多元。]

[原帖作者收到新设备，评论围绕设备能运行的Deepseek相关模型展开，包括模型测试、性能指标、基准测试等内容，整体氛围积极且充满技术探讨]

[对Ling系列模型的讨论涉及性能、制作方式、比较合理性等多方面，有提问、质疑、建议等不同观点，整体氛围理性客观]

[原帖提到Chonkie库在GitHub消失、网站下线，评论中有人提供资源获取方式、猜测消失原因并给出替代方案和解决工作使用中的相关问题等]

[关于荷兰有很多3090 FE在售，大家从价格、性价比、散热、噪音、市场等多方面展开讨论，氛围比较理性客观]

[围绕Jensen Huang与GPU相关的视频展开讨论，涉及英伟达商业策略、GPU的多方面内容、企业贪婪等，有不同的观点和多样的情感倾向。]

[这是一个关于DeepSeek - V3 - 0324不同量化版本的讨论，多数人对发布者的工作表示赞同和感谢，其中2.71位量化版本受到较多关注，也有一些人在交流相关技术问题]

[原帖是关于RigoChat 2论文中llama.cpp量化对质量退化影响的研究，评论者们从量化性能、模型可用性、评判标准等方面展开讨论，有不同的观点碰撞，整体氛围较理性]