模型与技术 其他

手机上的Gemma 4b

[帖子围绕Gemma 4b在手机上运行展开讨论,涉及模型训练、手机相关操作、遇到的问题、性能表现等多方面内容,整体氛围较为平和,大家积极分享观点和经验]

 ·  · 
模型与技术 新模型发布

谷歌Gemma 3已在Huggingface上发布并加入Ollama

[围绕Gemma 3在Huggingface发布以及被添加到Ollama展开讨论,涉及运行问题、技术参数、模型比较、推理能力等多方面,整体讨论热度不高但内容丰富]

 ·  · 
模型与技术 性能对比

Slim Attention:无损减半上下文内存

[围绕Slim attention技术展开讨论,包括与其他技术的比较、技术原理、对内存的影响等,整体氛围积极且充满期待]

 ·  · 
模型与技术 训练与微调技术

通过笔记本让Gemma3进行推理

[原帖分享让Gemma 3推理的笔记本,评论主要围绕Gemma 3展开,涉及性能、训练、操作步骤等多方面,氛围比较积极且充满好奇]

 ·  · 
模型与技术 性能对比

Gemma3失误过多,难以使用

[关于Gemma3是否好用的讨论,大家分享使用体验,多数指出其存在问题,但也有正面评价,整体氛围较理性。]

 ·  · 
模型与技术 其他

期待无审查版Gemma 3发布

[原帖询问Gemma 3未审查版本的发布时间,评论围绕Gemma 3未审查版本的发布、作用、审查相关、模型限制、系统提示等方面展开,有期待、质疑、调侃等多种态度]

 ·  · 
模型与技术 性能对比

LLM的英语K_量化不会过度降低多语言性能

[原帖分享量化对多语言LLMs影响的研究结果,评论者有推荐相关论文、表达感谢、提出质疑、对比量化方法、探讨研究方向等不同反应。]

 ·  · 
模型与技术 性能对比

Gemma 3与Qwen 2.5基准测试对比(指令调优版)

[关于Gemma 3和Qwen 2.5基准比较的讨论,涉及比较的代表性、模型特性、性能表现等多方面,大家看法不一,整体氛围较为理性]

 ·  · 
模型与技术 新模型发布

3月12日新Gemma模型发布

[围绕3月12日Gemma模型的发布,讨论包括对新模型的期待、不同版本的需求、发布内容及相关性能等多方面的观点交流,整体氛围积极且充满期待]

 ·  · 
模型与技术 技术讨论

本地模型执行递归代理工作流的强大力量(Mistral - small)

[关于本地模型执行递归代理工作流(mistral - small)的帖子引发了诸多讨论,包括对模型能力、相关技术、项目进展、界面等方面的好奇与疑问,还有技术交流、项目反馈等内容,整体氛围积极且充满探索性]

 ·  ·