模型与技术 技术讨论

Gemini 2.0 PRO不够强?用<系统提示>使其像R1一样思考

[原帖探讨Gemini 2.0 PRO按特定提示思考时长不如R1的问题并寻求改进,评论涉及多种解决思路、对做法的疑惑、相关研究引用等,整体氛围较为理性探讨]

 ·  · 
模型与技术 性能对比

LLMs如gpt - 4o的输出表现

[原帖作者对LLMs做元评估,让LLMs相互评判,评论者对原帖工作表示肯定、提问、补充信息、分享相关技术等,整体氛围平和]

 ·  · 
模型与技术 技术讨论

深探V3/R1推理系统概览

[该讨论围绕DeepSeek - V3/R1推理系统展开,涉及营收成本计算、商业决策、与其他公司对比、开源模型受益等多方面内容,整体氛围积极且讨论深入]

 ·  · 
模型与技术 新模型发布

首个所见的真正开源DeepResearch尝试

[原帖介绍Search - R1项目,评论者围绕该项目从强化学习重要性、资源获取、模型能力期待、安卓应用相关、项目评估、对项目不满及技术选择等方面展开讨论,氛围较为理性且多元。]

 ·  · 
模型与技术 技术讨论

为何温度为0不佳?通俗易懂解释

[围绕温度为0是否不好展开讨论,存在多种观点,有从模型原理、实验测试等不同角度分析,整体氛围理性且充满技术探讨]

 ·  · 
模型与技术 新模型发布

Fallen Llama 3.3 R1 70B v1可在家体验

[关于Drummer"s Fallen Llama 3.3 R1 70B v1,大家讨论了R1特性、模型表现、q6 quant相关话题,还有人认为标题描述不足,也有表示感谢、提出询问等情况,整体氛围较为平和。]

 ·  · 
模型与技术 模型更新

Phi-4 - mini的漏洞修复与GGUFs

[原帖发布Phi - 4 - mini的Bug修复及相关资源,评论围绕模型发布错误、对技术方面的疑惑、表示感谢等展开,氛围较为积极且充满技术探讨]

 ·  · 
模型与技术 新模型发布

TinyR1 - 32B - 预览:超级蒸馏以仅5%的参数量实现接近R1的性能

[关于TinyR1 - 32B - Preview的讨论,包含对模型的不信任、质疑其是否为骗局,还有人提到Qihoo360声誉不佳,同时也涉及到一些模型相关的技术观点和体验等内容,整体氛围充满争议。]

 ·  · 
模型与技术 训练与微调技术

本地微调大型语言模型的最快方法

[关于本地微调大型语言模型(LLM)的项目,大家讨论了设备是否适合初学者、不同设备显存情况、与其他工具的差异、项目的推广和应用设想,还有项目缺乏MacOS支持的问题,整体氛围比较积极理性]

 ·  · 
模型与技术 新模型发布

仅花20美元训练出能说法语的推理模型

[原帖作者分享仅用20美元训练出一个法语推理模型,评论者围绕模型的训练细节、成本、性能、使用案例等提问、表示赞同或质疑,同时还夹杂着幽默的互动和与法国文化相关的调侃]

 ·  ·