模型与技术 新模型发布

Deepseek V3已上线

[Deepseek V3上线,引发关于其参数规模、版本发布、开源情况、性能表现等多方面的讨论,整体氛围积极且充满期待,同时也存在一些疑惑与质疑。]

 ·  · 
模型与技术 新模型发布

高山LLaMA:GPU和磁盘空间不足者的福音

[关于Alpine LLaMA项目,大家从不同角度展开讨论,包括项目融合、技术实现、功能支持、适用性等方面,整体氛围较为理性探讨]

 ·  · 
模型与技术 新模型发布

Qwen新发布

[围绕Qwen发布展开多方面讨论,包括模型性能、开源情况、图像识别相关,以及一些技术问答和节日祝福等,氛围积极且充满好奇]

 ·  · 
模型与技术 新模型发布

Llama 3.2 3B性能出色

[围绕llama 3.2 3B模型展开多方面讨论,包括性能、速度、不同设备运行情况、与其他模型比较等,有正面评价也有质疑,整体氛围积极且充满探索性]

 ·  · 
模型与技术 新模型发布

Qwen/QVQ - 72B - Preview模型在Hugging Face平台

[围绕Qwen/QVQ - 72B - Preview展开讨论,包含对模型大小的质疑、对模型表现的惊叹、对运行设备的探讨以及一些资源分享等内容,整体氛围积极且充满探索性]

 ·  · 
模型与技术 新模型发布

Aider发布新的更难代码编辑基准

[Aider发布新的代码编辑基准测试(Polyglot基准测试涵盖6种语言)引发讨论,涉及JavaScript题目难度、模型表现、Qwen相关情况、C#被忽视、基准测试饱和等话题,整体讨论氛围热烈且话题多元。]

 ·  · 
模型与技术 新模型发布

LLMs发展迅猛,新时代将至

[原帖感慨LLMs发展迅速,评论者们从不同角度如自身应用体验、技术限制、发展对比等表达对LLMs发展的看法,整体氛围积极乐观]

 ·  · 
模型与技术 新模型发布

当前14b左右的最佳模型有哪些?

[围绕当前14b左右最佳模型展开讨论,涉及多种模型推荐、比较以及性能评价,整体氛围积极交流]

 ·  · 
模型与技术 新模型发布

llama.cpp支持Llama-3_1-Nemotron-51B

[原帖发布llama.cpp支持Llama - 3_1 - Nemotron - 51B的消息,评论者有表达兴奋、感谢的,也有提及模型相关技术更新、开发、特性、比较等内容,还有一些如硬件需求、首次使用遇到问题等其他话题的讨论]

 ·  · 
模型与技术 新模型发布

Phi - 4通用版本发布情况

[原帖询问微软宣称周末于HF发布的Phi - 4未发布且无消息,评论围绕Phi - 4的发布情况展开,有调侃、推测未发布原因、提供相关信息等多种观点,整体氛围较疑惑且夹杂失望情绪]

 ·  ·