模型与技术 性能对比

Nemotron - 49B的KV缓存较源Llama - 70B少70%

[原帖讲述Nemotron - 49B相比Llama - 70B使用70%更少KV缓存等研究成果,评论者们从不同角度如模型在特定量化下的表现、在不同VRAM下的运行情况、对原帖部分观点的质疑等展开讨论]

 ·  · 
模型与技术 性能对比

Falcon3-7b为何很少被用作模型(或被引用)

[关于Falcon3 - 7b很少被使用或引用的原因展开讨论,涉及模型性能、许可证、宣传等多方面因素,大家各抒己见且存在多种不同观点]

 ·  · 
模型与技术 性能对比

Gemini 2.5 Pro在ARC AGI 2上的测试结果

[原帖发布Gemini 2.5 Pro Exp在ARC AGI 2上的测试结果并表达看法,评论从结果是否最终、模型在理解运动方面的表现、ARC - AGI测试是否易被操纵、帖子板块合理性、不同模型在特定谜题测试中的表现等多方面展开讨论,整体氛围理性探讨]

 ·  · 
模型与技术 性能对比

DeepSeek V3 0324在Livebench上超越Claude 3.7

[围绕DeepSeek V3 (0324)在LiveBench上超越Claude 3.7展开讨论,涉及DeepSeek V3的性能下降、幻觉问题等,也包含其他模型如grok - 3 - beta、Anthropic、Open AI的相关情况,讨论氛围较理性且包含多种观点]

 ·  · 
模型与技术 性能对比

Gemma 3的问题出在哪?

[关于Gemma 3存在的各种问题如像受惊仆人、过度道歉、自我重复等展开讨论,涉及系统提示、参数设置等方面的看法,有调侃也有同情,整体氛围较为理性探讨]

 ·  · 
模型与技术 性能对比

QwQ - 32B的KV_cache/模型大小比率最高?

[原帖探讨QwQ - 32B的KV_cache/model_size比例,评论主要指出原帖计算错误、提供数据修正并对不同模型缓存相关问题展开讨论,整体氛围较专业理性]

 ·  · 
硬件与部署 性能对比

M3 Ultra Mac Studio 512GB对Deepseek V3 671b模型的prompt和写入速度

[原帖分享M3 Ultra Mac Studio运行Deepseek V3的速度测试数据,评论者有的对速度失望、有的质疑测试,也有人认可数据价值,整体氛围偏向对设备性能不满。]

 ·  · 
模型与技术 性能对比

DeepSeek - V3在M3 Ultra 512GB上4位量化每秒处理超20k个词元且功耗低于200瓦

[关于DeepSeek - V3在消费级硬件(如M3 Ultra)上运行的话题,大家从模型性能、速度、硬件相关等多方面进行讨论,存在不同观点且争议较大,整体氛围理性且技术向]

 ·  · 
模型与技术 性能对比

Gemini 2.5 Pro Exp 03 - 25在Livebench中排名第一

[关于gemini - 2.5 - pro - exp - 03 - 25在Livebench排名第一的帖子引发了多方面讨论,包括模型的来源推测、模型能力评估、付费与使用权限、免费资源的请求次数限制等内容,讨论氛围热烈且存在多种观点的交锋]

 ·  · 
模型与技术 性能对比

开源中的多模态目前很糟糕

[原帖认为开源多模态大语言模型目前糟糕,各公司难以复制OpenAI或Gemini成功,评论者从不同角度阐述开源多模态模型现状、未来、存在的问题等,有多种观点碰撞,整体氛围理性讨论]

 ·  ·