硬件与部署 硬件选择

GMKTec确认2025年5月推出Ryzen AI Max+ 395,最强AI迷你PC竞争升温

[围绕GMKTec将于2025年5月推出的Ryzen AI Max + 395产品展开讨论,涉及与其他产品比较、性能、价格等多方面内容,有对产品的期待、质疑等不同情感]

 ·  · 
行业与社区 政策与伦理

最佳无审查大语言模型

[原帖询问非色情类无审查的大型语言模型(LLM),评论围绕推荐无审查LLM、获取模型内容的方法、审查相关问题等展开,整体氛围活跃且充满探索性]

 ·  · 
模型与技术 新模型发布

混合自回归/扩散大型语言模型Block Diffusion

[围绕Block Diffusion(混合自回归/扩散LLM)展开讨论,有对其优势和潜力的肯定,也涉及技术发展面临的限制,还包含一些对未来发展的预测和趣味建议等,整体氛围积极且充满探索性]

 ·  · 
硬件与部署 性能对比

M2 Ultra与M3 Ultra使用KoboldCpp的速度对比

[原帖对M2 Ultra和M3 Ultra在Koboldcpp中的速度比较结果引发多种讨论,包括对结果的疑惑、质疑、推测,还有基于结果的设备选择建议、性价比讨论等,整体氛围热烈且观点多元]

 ·  · 
模型与技术 性能对比

Gemma 3 27B在AI Studio和Ollama间的性能差异

[原帖探讨Gemma 3 27b模型在ai studio和ollama上性能存在差异,评论中有人给出可能原因、技术建议、反驳嘲讽等,总体氛围比较理性探讨且夹杂少量争论]

 ·  · 
模型与技术 性能对比

QwQ-32B在本地ollama上似乎无用,有人成功解决吗?

[关于QwQ - 32B模型在本地ollama上运行时无法得到有效代码结果的问题,大家从不同角度如模型设置、硬件条件、使用环境等进行了讨论,氛围较为积极且充满技术探讨氛围]

 ·  · 
模型与技术 训练与微调技术

构建自定义多模态模型训练框架

[原帖介绍了用于训练自定义多模态模型的Cornstarch框架,评论围绕模型合并、训练、推理、框架相关疑问、经验分享等展开,整体氛围积极且富有技术交流氛围]

 ·  · 
模型与技术 技术讨论

指令撰写:如何让大语言模型深度推理并构建完整项目

[原帖介绍突破LLMs限制的工作成果及原理,评论围绕要求示例、计划发布、对成果的期待、质疑等展开,氛围比较多元]

 ·  · 
模型与技术 性能对比

Sesame"s CSM具有实际价值

[关于Sesame的CSM,原帖认为其不错,而评论者观点不一,有批评其存在营销误导等问题的,也有认同其有价值的,还涉及模型特性、速度、名称等多方面的讨论,整体氛围存在争议。]

 ·  · 
应用与工具 其他

现有最佳开源LLM的OCR有哪些?

[原帖寻求本地基于LLM的OCR开源软件推荐,评论者们给出了多种推荐如Qwen - VL 2.5、paddlerocr、olmOCR等,同时也有人指出OCR问题复杂无通用方案,整体氛围是积极提供建议]

 ·  ·