模型与技术 新模型发布

英伟达新推理模型

[NVIDIA新推理模型发布后,用户从模型性能、数据集、盈利模式、安全等多方面展开讨论,既有期待和肯定,也有质疑和不满,整体氛围热烈且多元]

 ·  · 
模型与技术 新模型发布

LG发布新推理模型EXAONE - Deep

[LG发布EXAONE - Deep推理模型,引发了包括对模型性能、许可协议、运行情况等多方面的讨论,其中有正面评价也有负面评价,同时还有一些与LG公司业务相关的讨论,整体氛围比较多元。]

 ·  · 
模型与技术 性能对比

开源78亿模型在多项基准测试中击败o1 mini

[关于开源7.8B模型在基准测试中击败o1 mini这一事件引发诸多讨论,包括对基准测试的质疑、模型性能与实用性的探讨、开源的定义以及不同模型间的比较等,整体氛围偏向怀疑与争议]

 ·  · 
模型与技术 新模型发布

SmolDocling - 256M参数的文档理解视觉语言模型

[原帖发布SmolDocling - 256M VLM for document understanding后,评论围绕模型资源获取、性能比较、功能疑问、多语言支持等展开,整体氛围积极且充满探索性]

 ·  · 
模型与技术 新模型发布

Mistral - Small - 3.1 - 24B - Instruct - 2503 - GGUF相关资源

[围绕bartowski/mistralai_Mistral - Small - 3.1 - 24B - Instruct - 2503 - GGUF这个模型展开讨论,涉及视觉功能、模型评价、与其他项目比较、版本差异等话题,氛围积极且有较多疑惑探讨]

 ·  · 
模型与技术 性能对比

Llama-3.3-Nemotron-Super-49B-v1基准测试

[围绕Llama - 3.3 - Nemotron - Super - 49B - v1 benchmarks展开讨论,涉及模型性能比较、基准测试意义、社区态度等多方面,氛围以理性探讨为主,存在对部分现象的质疑]

 ·  · 
模型与技术 训练与微调技术

微调后的Gemma 3模型分享

[原帖作者发布微调的Gemma 3模型并寻求反馈、分享训练计划,评论者有对不同版本模型的期待、询问功能和性能相关问题、提供资源以及进行测试等内容,整体氛围积极且充满探索性]

 ·  · 
模型与技术 性能对比

Gemma 3 27B与Mistral Small 3.1的实时基准测试结果

[关于Gemma 3 27B和Mistral Small 3.1的LiveBench结果,大家讨论了模型性能、存在的问题如幻觉、不同模型间比较等多方面内容,整体氛围积极且充满探索性]

 ·  · 
模型与技术 新模型发布

四月将推出LLAMA 4?

[关于LLAMA 4是否会在四月推出的讨论,包括对LLAMA影响力的看法、补充资源的提供以及对LLAMA 4技术参数等方面的疑问,整体氛围积极期待]

 ·  · 
模型与技术 性能对比

Mistral Small 3.1测试结果

[围绕Mistral模型测试展开讨论,包括其与其他模型比较、自身特性如无幻觉、以及对相关模型如gpt - 4 - o mini和qwen coder 32b的看法等,氛围积极且讨论方向多样]

 ·  ·