模型与技术 性能对比

Gemma 3 27B在四个独立基准测试中的得分:评估不同差异大

[该讨论围绕Gemma 3 27B在独立基准测试中的得分情况展开,涉及模型的不同表现、与其他模型对比、存在的问题以及部分模型如Phi - 4、QwQ - 32B的相关评价等,讨论氛围较为理性且观点多样]

 ·  · 
模型与技术 性能对比

Deepseek R1成参考,Qwen QwQ 32B性能相似但尺寸更合理

[关于Deepseek R1仍为参考而Qwen QwQ 32B性能相似却未成为参考的原因,大家从性能、基准测试、知名度等多方面展开讨论,氛围较为理性且充满技术探讨]

 ·  · 
模型与技术 新模型发布

SoftWhisper更新:2分钟转录2小时内容!

[SoftWhisper更新,用户对其功能、性能、依赖等方面进行讨论,整体讨论热度低且氛围平和]

 ·  · 
模型与技术 新模型发布

块扩散:自回归与扩散语言模型之间的插值

[围绕Block Diffusion论文展开讨论,涉及AI研究成果更新快,扩散和块扩散在LLM中的特性、优势局限,以及扩散模型与自回归模型的因果预测能力比较等内容,讨论氛围较理性]

 ·  · 
模型与技术 新模型发布

新型反向推理模型助力合成推理生成的优化与低成本扩展

[围绕TraceBack推理模型展开讨论,涉及模型特点、训练情况、改进方向以及相关模型的训练经验分享,整体氛围积极且富有探索性]

 ·  · 
模型与技术 新模型发布

谷歌Gemma 3发布

[围绕Gemma 3发布展开讨论,涉及不同版本特性、性能表现、与其他模型对比、应用场景、存在的问题以及用户的期待等多方面内容,整体氛围积极且充满探索性]

 ·  · 
模型与技术 训练与微调技术

通过修改代码使Llama - 8B在RTX 4090上训练1小时提升研究能力

[原帖作者修改Unsloth的GRPO代码使Llama - 8B能自我提升研究技能,在RTX 4090上训练1小时准确率提升,评论者大多表示认可并提出疑问、分享想法等,整体氛围积极]

 ·  · 
模型与技术 性能对比

Gemma 3性能惊人

[Reddit用户们就Gemma 3展开讨论,涉及多个版本在不同任务中的表现、与其他模型对比,多数用户认可其表现,但也指出了一些问题,整体氛围积极且充满探索性]

 ·  · 
模型与技术 新模型发布

Gemma 3 27b已在Google AI Studio上线

[围绕Gemma 3 27b在Google AI Studio可用展开讨论,涉及性能、速度、翻译能力、编码能力等方面的评价,还有一些相关疑问和资源分享等内容,整体氛围比较多元。]

 ·  · 
模型与技术 新模型发布

Gemma 3的GGUF版本及推荐设置

[围绕Gemma 3展开多方面讨论,包括模型性能、排名、运行问题等,存在不同观点和疑惑,整体氛围较为技术探讨性]

 ·  ·