模型与技术 新模型发布

Gemma 3 27b已在Google AI Studio上线

[围绕Gemma 3 27b在Google AI Studio可用展开讨论,涉及性能、速度、翻译能力、编码能力等方面的评价,还有一些相关疑问和资源分享等内容,整体氛围比较多元。]

 ·  · 
其他 其他

Gemma 3 27B

[该讨论围绕Gemma 3 27B展开,涉及GPT工作情况、Grok 3的无趣、游戏情节、超现实荒诞想象、AI助手经历、幽默的家庭聚会故事等多方面内容,氛围轻松诙谐且话题多样。]

 ·  · 
行业与社区 社区项目展示

Gemma 3开源工作中的llama.cpp与MLX社区

[围绕Gemma 3 - Open source efforts - llama.cpp - MLX community展开讨论,有对Google支持llama.cpp的惊喜与期待,对谷歌团队工作的赞同,也有关于技术方面如在特定软件中使用Gemma 3的疑问和问题,整体氛围积极且充满对新技术的探索欲]

 ·  · 
模型与技术 新模型发布

Gemma 3的GGUF版本及推荐设置

[围绕Gemma 3展开多方面讨论,包括模型性能、排名、运行问题等,存在不同观点和疑惑,整体氛围较为技术探讨性]

 ·  · 
模型与技术 其他

手机上的Gemma 4b

[帖子围绕Gemma 4b在手机上运行展开讨论,涉及模型训练、手机相关操作、遇到的问题、性能表现等多方面内容,整体氛围较为平和,大家积极分享观点和经验]

 ·  · 
其他 其他

QwQ高思维努力设置一次性解决弹球示例

[关于QwQ高思维努力设置一次性击中弹跳球示例的讨论,涉及技术原理、模型改进、测试结果、存在问题及与OpenAI的推测比较等多方面内容,整体氛围积极且充满探索性]

 ·  · 
硬件与部署 性能测试

EXO Labs在两台512GB M3 Ultra Mac Studios上运行8位DeepSeek R1达11t/s

[围绕EXO Labs在特定设备上的运行情况展开讨论,涉及设备性价比、性能比较等多方面,有惊叹、肯定、否定等不同态度,总体氛围比较多元]

 ·  · 
模型与技术 新模型发布

谷歌Gemma 3已在Huggingface上发布并加入Ollama

[围绕Gemma 3在Huggingface发布以及被添加到Ollama展开讨论,涉及运行问题、技术参数、模型比较、推理能力等多方面,整体讨论热度不高但内容丰富]

 ·  · 
其他 其他

《Gemma3技术报告详细分析》

[对Gemma3技术报告进行分析,涉及架构、长语境、蒸馏等方面,比较了Gemma3和Gemma2,还提到谷歌发布Gemma3模型带来的影响,整体氛围较积极探讨性强]

 ·  · 
模型与技术 性能对比

Slim Attention:无损减半上下文内存

[围绕Slim attention技术展开讨论,包括与其他技术的比较、技术原理、对内存的影响等,整体氛围积极且充满期待]

 ·  ·