模型与技术 性能对比

Gemma 3与Qwen 2.5基准测试对比(指令调优版)

[关于Gemma 3和Qwen 2.5基准比较的讨论,涉及比较的代表性、模型特性、性能表现等多方面,大家看法不一,整体氛围较为理性]

 ·  · 
硬件与部署 其他

Gemma 3 1B在安卓上通过ChatterUI运行

[围绕Gemma 3 1B on Android via ChatterUI展开讨论,涉及模型表现、应用体验、遇到的问题、寻求iOS类似应用以及一些挑战想法,整体氛围积极正面]

 ·  · 
硬件与部署 性能对比

Gemma3 - 12b - Q4在Ollama上比Deepseek - R1 - 14b - q8慢很多?是我弄错了吗

[原帖探讨Gemma3 - 12b - Q4在Ollama上比Deepseek - R1 - 14b - q8慢的问题,评论从kv缓存、系统配置、模型本身等多方面分析原因]

 ·  · 
应用与工具 开发工具与框架

smOllama:Ollama的轻量聊天界面

[围绕smOllama这个轻量级Ollama模型网络接口展开讨论,涉及项目展示、应用体验、功能改进等方面,整体氛围积极。]

 ·  · 
硬件与部署 其他

使用机架式机箱容纳两个以上GPU

[围绕多GPU的机架式机箱使用展开讨论,包含机箱推荐、硬件改造、散热等方面的内容,整体氛围较为理性务实]

 ·  · 
应用与工具 开发工具与框架

尝试使用新的Gemma Python库体验Gemma 3

[关于Gemma 3新库,有评论者对谷歌不支持标准API端点表示失望,还有评论者从用户视角提出谷歌不应频繁开发新库、希望有整合库、当前生态系统碎片化和文档需改进等观点,也有回应解释的理性交流]

 ·  · 
硬件与部署 其他

M3 Ultra 512GB搭配Deepseek R1 671B Q4达18T/s

[该讨论围绕M3 Ultra 512GB设备展开,涉及性能、功耗、性价比、编码能力等多方面,既有对其正面评价,也有质疑和反对声音,整体氛围比较理性且充满技术探讨的氛围]

 ·  · 
模型与技术 新模型发布

3月12日新Gemma模型发布

[围绕3月12日Gemma模型的发布,讨论包括对新模型的期待、不同版本的需求、发布内容及相关性能等多方面的观点交流,整体氛围积极且充满期待]

 ·  · 
行业与社区 其他

o3 - mini开源承诺的现状

[围绕o3 - mini开源承诺未兑现展开讨论,涉及OpenAI等主体,观点包括谴责、质疑、调侃,也有对未兑现原因的猜测,整体氛围多为不满和怀疑]

 ·  · 
模型与技术 技术讨论

本地模型执行递归代理工作流的强大力量(Mistral - small)

[关于本地模型执行递归代理工作流(mistral - small)的帖子引发了诸多讨论,包括对模型能力、相关技术、项目进展、界面等方面的好奇与疑问,还有技术交流、项目反馈等内容,整体氛围积极且充满探索性]

 ·  ·