模型与技术 性能对比

闪念注意力对QwQ推理模型智能影响有多大

[在关于Flash Attention对QwQ推理模型智能影响的讨论中,多数观点认为Flash Attention无负面影响且在很多方面有优势,也存在不同使用体验的分享]

 ·  · 
模型与技术 新模型发布

Qwen2.5 - VL的GGUF转换尝试

[原帖介绍GGUF for Qwen2.5 - VL相关内容,评论围绕技术比较、模型优劣、机器人项目、技术实现等展开,整体氛围积极探索]

 ·  · 
其他 其他

块扩散

[关于“Block Diffusion”的讨论涵盖其与其他技术的比较、在推理和思考方式上的联系、不同的使用体验和评价,既有积极支持也有质疑反对,总体氛围充满探索性]

 ·  · 
行业与社区 公司动态

深擎科技要求研发人员上交护照限制出国,开源情况下此举令人费解

[围绕DeepSeek所有者要求研发人员上交护照不能出国旅行这一事件展开讨论,涉及中国企业管理、中美关系、人才竞争与保护等多方面,观点多样且存在争议]

 ·  · 
硬件与部署 本地部署方案

打造可本地运行的ManusAI替代方案

[原帖介绍了可本地运行的ManusAI替代项目agenticSeek,评论者有尝试意向、提出改进建议、表达认可或质疑,整体氛围积极且有建设性]

 ·  · 
其他 其他

Llama 3.3可防止阳光盗窃

[帖子标题提到Llama 3.3防止太阳盗窃,评论围绕人工智能(如Gemma 3、Gemini等)的表现、审查情况、荒诞设想及各种诙谐调侃展开,整体氛围轻松且多元]

 ·  · 
模型与技术 新模型发布

GPT-Sovits V3 TTS发布:零样本语音克隆,多语言

[关于GPT - Sovits V3发布,有正面评价、对比其他产品、指出问题、对项目名不满等多种观点的讨论,整体氛围较多元]

 ·  · 
应用与工具 其他

深度研究工具不尽人意

[原帖对深度研究AI工具感到失望,评论者们从工具的准确性、有用性、与其他工具的比较等多方面展开讨论,整体氛围以指出问题为主]

 ·  · 
硬件与部署 其他

廉价机器上的本地大语言模型:一页总结

[关于在廉价机器上运行本地大型语言模型(LLM)的讨论,包括模型选择、硬件限制、量化影响以及性价比等方面,整体氛围较为技术探讨性]

 ·  · 
模型与技术 性能对比

期待无审查的Gemma3b尽快到来

[原帖对Gemma3b模型感到不满,认为其无聊,评论围绕该模型展开,涉及模型审查、评价、不同版本体验以及相关改进建议等多方面内容,讨论氛围比较多元,有赞同也有反对]

 ·  ·