模型与技术 新模型发布

Qwen下周发布将更小,QwQ - Max稍晚全面发布

[关于Qwen下周发布“更小”版本和QwQ - Max稍晚全面发布的消息,大家表达了期待、支持,同时有对版本规模、模型用途等的猜测,还涉及中国公司在开源社区的表现以及不同模型的比较等内容,整体氛围积极且充满探索性]

 ·  · 
模型与技术 性能对比

Deepseek r1与Claude 3.7 Sonnet测试对比结果

[原帖比较Claude 3.7 Sonnet和Deepseek r1引发诸多讨论,包括模型质量、本地运行、数据安全等方面,评论者观点有支持、有质疑且存在争议]

 ·  · 
模型与技术 技术讨论

Gemini 2.0 PRO不够强?用<系统提示>使其像R1一样思考

[原帖探讨Gemini 2.0 PRO按特定提示思考时长不如R1的问题并寻求改进,评论涉及多种解决思路、对做法的疑惑、相关研究引用等,整体氛围较为理性探讨]

 ·  · 
应用与工具 特定领域应用

低成本训练AI理解工作中的规章手册

[原帖寻求让AI低成本理解600页规章手册的方法,评论提出了多种方案如RAG、Gemini 2.0、微调模型等并探讨各自优劣,同时也有对回答方向的争议]

 ·  · 
模型与技术 性能对比

LLMs如gpt - 4o的输出表现

[原帖作者对LLMs做元评估,让LLMs相互评判,评论者对原帖工作表示肯定、提问、补充信息、分享相关技术等,整体氛围平和]

 ·  · 
硬件与部署 硬件选择

千元入手是否划算?(RTX 3090 24GB、Ryzen 5 5600X、X570 Aorus Elitei7 + 16GB DDR4)

[原帖询问价值1000美元包含特定配置的二手游戏电脑用于软件开发是否值得购买,大部分评论者认为值得,理由多与RTX 3090的价值有关,同时也讨论了一些硬件相关的细节问题,整体氛围积极赞同。]

 ·  · 
应用与工具 其他

漫画翻译工具

[原帖寻求高质量免费且本地模型的漫画翻译工具,评论者们推荐了一些工具并分享了相关项目经验,同时也指出目前存在的工具多有局限性]

 ·  · 
硬件与部署 配置

用3块锐龙395主板本地运行R1是否最佳

[原帖询问用3块主板运行R1的方案是否为5000美元左右运行R1的最佳方式,评论者从不同角度表示反对,涉及硬件、模型实用性、网络带宽等多方面内容]

 ·  · 
硬件与部署 其他

旧RX 580 GPU再利用求建议

[帖子作者想利用800个闲置RX 580 GPU做并行计算工作负载,评论者们给出各种建议、分享经验,有认为可行的,也有觉得不值得的,整体氛围积极探讨]

 ·  · 
硬件与部署 配置

搭建低成本家庭实验室服务器

[原帖作者在妻子要求低成本的情况下构建家庭实验室服务器,分享相关配件及计划,评论者围绕硬件选择、运行模型的硬件要求、对原帖作者表示祝福、对设备性能测试等方面展开讨论]

 ·  ·