模型与技术 新模型发布

Pixtral Large发布:基于Mistral Large 2的视觉模型

[关于Pixtral Large发布的讨论,涉及模型评估对比、开放权重、运行限制、功能等多方面,有对其能力的质疑、运行环境的探讨和功能的疑问等,整体氛围较为理性且多元]

 ·  · 
模型与技术 新模型发布

Nvidia推出LLaMA - Mesh:用Llama 3.1 8B生成3D网格,即将发布权重

[围绕Nvidia的LLaMA - Mesh在3D模型生成方面展开讨论,涉及技术特点、应用场景、局限性等多方面内容,大家观点各异,有赞赏也有怀疑,总体氛围积极且充满探索性]

 ·  · 
模型与技术 新模型发布

Mistral AI发布Mistral Large 3和Pixtral Large(目前似乎仅API可用)

[Mistral AI发布Mistral Large 3和Pixtral Large引发讨论,包括对新模型的期待、现有模型的不满、价格考量、技术相关问题以及对权重发布的关注等,整体氛围积极与担忧并存]

 ·  · 
模型与技术 新模型发布

Omnivision - 968M:适用于边缘设备的视觉语言模型,标记减少9倍

[围绕Omnivision - 968M模型展开讨论,涉及功能、性能、运行等多方面,有肯定也有质疑,整体氛围较为积极]

 ·  · 
模型与技术 新模型发布

Gemma和Phi模型更新久未发布,3代和4代何时到来

[帖子询问Gemma 3和Phi 4的发布时间,评论围绕Gemma 3的预计发布时间、Gemma 2的更新期待、Llama模型发布时间预测、开发者回应以及一些调侃和回忆展开,整体氛围较为轻松且充满期待]

 ·  · 
模型与技术 新模型发布

Nexusflow发布Athene - V2 - Chat和Athene - V2 - Agent

[Nexusflow发布Athene - V2套件引发讨论,包含对其性能、测试情况、实际质量、在不同任务中的表现等方面的看法,整体氛围较为积极且充满好奇]

 ·  · 
模型与技术 新模型发布

新的开源背景去除模型BEN达最先进水平

[新开源背景去除模型BEN发布,大家对其效果评价积极,也有对其与其他模型比较、技术应用、硬件需求等方面的讨论,还有少量幽默调侃和消极评价。]

 ·  · 
模型与技术 新模型发布

LLM模型的重复性与创造性及基于Qwen2.5 32B的ArliAI RPMax v1.3模型简述

[这是一个关于LLM模型和基于Qwen2.5 32B的ArliAI RPMax v1.3模型的讨论,涉及模型性能、训练、微调等方面,整体氛围积极且讨论较为专业]

 ·  · 
模型与技术 新模型发布

8GB显存下的最佳模型

[原帖主寻求8GB VRAM以下满足多种要求的最佳模型,评论者们纷纷给出推荐并分享相关经验,整体氛围积极且富有建设性]

 ·  · 
模型与技术 新模型发布

NousResearch推出Forge Reasoning API测试版和NousChat

[围绕NousResearch相关内容展开讨论,涉及模型的性能、开源与否、推理能力等方面,观点多样且有争议,整体氛围热烈]

 ·  ·