其他 其他

QwQ高思维努力设置一次性解决弹球示例

[关于QwQ高思维努力设置一次性击中弹跳球示例的讨论,涉及技术原理、模型改进、测试结果、存在问题及与OpenAI的推测比较等多方面内容,整体氛围积极且充满探索性]

 ·  · 
其他 其他

《Gemma3技术报告详细分析》

[对Gemma3技术报告进行分析,涉及架构、长语境、蒸馏等方面,比较了Gemma3和Gemma2,还提到谷歌发布Gemma3模型带来的影响,整体氛围较积极探讨性强]

 ·  · 
硬件与部署 其他

LM Studio更新支持Gemma 3 GGUF

[围绕LM Studio更新支持Gemma 3 GGUF展开讨论,涉及技术问题、使用体验、模型功能及参数等多方面,整体氛围以积极探讨和反馈问题为主]

 ·  · 
硬件与部署 其他

Gemma 3性能快速且良好

[关于Gemma 3又快又好的说法引发多种讨论,有怀疑其性能和评分真实性的,也有对其表示期待的,整体氛围争议性较强]

 ·  · 
模型与技术 其他

期待无审查版Gemma 3发布

[原帖询问Gemma 3未审查版本的发布时间,评论围绕Gemma 3未审查版本的发布、作用、审查相关、模型限制、系统提示等方面展开,有期待、质疑、调侃等多种态度]

 ·  · 
其他 其他

JSON会使大语言模型变笨吗?

[围绕JSON是否会使大型语言模型变笨展开讨论,涉及JSON和YAML等格式对比、模型训练材料、不同格式下模型的输出表现等,整体氛围比较理性探讨]

 ·  · 
其他 其他

我称它为Daddy LLM

[围绕名为“Daddy LLM”的事物展开多方面讨论,包括花费、放置位置、命名、技术相关以及一些诙谐幽默的互动等,整体氛围比较轻松随意]

 ·  · 
硬件与部署 其他

Gemma 3 1B在安卓上通过ChatterUI运行

[围绕Gemma 3 1B on Android via ChatterUI展开讨论,涉及模型表现、应用体验、遇到的问题、寻求iOS类似应用以及一些挑战想法,整体氛围积极正面]

 ·  · 
硬件与部署 其他

使用机架式机箱容纳两个以上GPU

[围绕多GPU的机架式机箱使用展开讨论,包含机箱推荐、硬件改造、散热等方面的内容,整体氛围较为理性务实]

 ·  · 
硬件与部署 其他

M3 Ultra 512GB搭配Deepseek R1 671B Q4达18T/s

[该讨论围绕M3 Ultra 512GB设备展开,涉及性能、功耗、性价比、编码能力等多方面,既有对其正面评价,也有质疑和反对声音,整体氛围比较理性且充满技术探讨的氛围]

 ·  ·