深度探索Deepseek v3 0324:国内的Sonnet 3.5

[原帖讨论Deepseek v3 0324模型的能力并与Claude 3.5 Sonnet比较,评论围绕模型运行的硬件、成本、性能、推理能力等多方面展开,氛围较理性且有不同观点交流]

 ·  · 

DeepSeek - V3在M3 Ultra 512GB上4位量化每秒处理超20k个词元且功耗低于200瓦

[关于DeepSeek - V3在消费级硬件(如M3 Ultra)上运行的话题,大家从模型性能、速度、硬件相关等多方面进行讨论,存在不同观点且争议较大,整体氛围理性且技术向]

 ·  · 

谷歌发布用于治疗应用的TxGemma开放模型

[关于Google发布TxGemma用于治疗应用的开放模型,有对其性能的期待、对模型相关的疑惑、责任的疑问、也有表示认可和积极态度的,整体讨论氛围多元。]

 ·  · 

我刚收到新设备

[原帖作者收到新设备,评论围绕设备能运行的Deepseek相关模型展开,包括模型测试、性能指标、基准测试等内容,整体氛围积极且充满技术探讨]

 ·  · 

InclusionAI发布Ling系列新模型

[对Ling系列模型的讨论涉及性能、制作方式、比较合理性等多方面,有提问、质疑、建议等不同观点,整体氛围理性客观]

 ·  · 

工作常用的Chonkie库在GitHub消失

[原帖提到Chonkie库在GitHub消失、网站下线,评论中有人提供资源获取方式、猜测消失原因并给出替代方案和解决工作使用中的相关问题等]

 ·  · 

荷兰有大量3090 FE在售

[关于荷兰有很多3090 FE在售,大家从价格、性价比、散热、噪音、市场等多方面展开讨论,氛围比较理性客观]

 ·  · 

黄仁勋谈GPU

[围绕Jensen Huang与GPU相关的视频展开讨论,涉及英伟达商业策略、GPU的多方面内容、企业贪婪等,有不同的观点和多样的情感倾向。]

 ·  · 

DeepSeek-V3-0324不同位量化版本发布及本地运行

[这是一个关于DeepSeek - V3 - 0324不同量化版本的讨论,多数人对发布者的工作表示赞同和感谢,其中2.71位量化版本受到较多关注,也有一些人在交流相关技术问题]

 ·  · 

llama.cpp量化导致质量下降的广泛基准测试

[原帖是关于RigoChat 2论文中llama.cpp量化对质量退化影响的研究,评论者们从量化性能、模型可用性、评判标准等方面展开讨论,有不同的观点碰撞,整体氛围较理性]

 ·  ·