模型与技术 新模型发布

四月将推出LLAMA 4?

[关于LLAMA 4是否会在四月推出的讨论,包括对LLAMA影响力的看法、补充资源的提供以及对LLAMA 4技术参数等方面的疑问,整体氛围积极期待]

 ·  · 
模型与技术 性能对比

Mistral Small 3.1测试结果

[围绕Mistral模型测试展开讨论,包括其与其他模型比较、自身特性如无幻觉、以及对相关模型如gpt - 4 - o mini和qwen coder 32b的看法等,氛围积极且讨论方向多样]

 ·  · 
模型与技术 性能对比

LG的EXAONE 2.4b模型性能超棒

[原帖探讨LG的EXAONE 2.4b模型在基准测试中的优异表现,评论有认可也有怀疑,还涉及模型许可证、与其他模型比较等内容,整体氛围争议与好奇并存]

 ·  · 
模型与技术 新模型发布

LG发布Exaone深度思考模型

[围绕LG发布的Exaone Deep Thinking Model展开讨论,涉及模型性能、许可证、实用性等多方面内容,有调侃、疑问、期待等多种态度。]

 ·  · 
模型与技术 新模型发布

昆仑万维公司发布Skywork - R1V - 38B(视觉思维链推理模型)

[昆仑万维发布Skywork - R1V - 38B模型引发讨论,涉及与其他公司竞争、模型发展阶段、基准测试等话题,既有对新模型的认可也有疑惑等不同态度。]

 ·  · 
硬件与部署 硬件选择

NVIDIA推出DGX Spark和DGX Station台式机进军AI PC领域:72核Grace CPU、Blackwell GPU、最高784GB内存

[NVIDIA推出DGX Spark和DGX Station台式机,大家围绕其价格、性能、性价比、在企业和消费者中的定位、产品功能等方面展开讨论,整体氛围比较务实,大家从不同角度表达看法]

 ·  · 
模型与技术 性能对比

Mistral Small 3.1未包含在公告中的基准性能

[围绕Mistral Small 3.1在未公告基准测试中的性能展开讨论,包含与其他模型的比较、对基准测试本身意义的质疑、模型在不同场景下的表现等多方面内容,整体讨论热度不高,观点多样]

 ·  · 
硬件与部署 内存需求

ollama 0.6.2预发布版让Gemma 3正常工作

[ollama 0.6.2预发布版本使Gemma 3的性能得到提升,引发了关于其功能、内存使用、参数设置等方面的讨论,总体氛围积极且具有一定的技术探讨性]

 ·  · 
模型与技术 性能对比

Gemma3在STEM领域表现令人失望

[原帖认为Gemma3在STEM方面表现一般,众多评论围绕Gemma3的性能展开讨论,有比较、分析、提出改进建议等,整体氛围较为理性探讨。]

 ·  · 
模型与技术 性能对比

EXAONE-Deep-7.8B或为体验过的最差推理模型

[围绕EXAONE - Deep - 7.8B模型的表现展开讨论,有认为模型表现差的,也有反驳称是配置或量化问题的,整体氛围是对该模型的质疑与探索]

 ·  ·