模型与技术 性能对比

DeepSeek V3 0324在Livebench上超越Claude 3.7

[围绕DeepSeek V3 (0324)在LiveBench上超越Claude 3.7展开讨论,涉及DeepSeek V3的性能下降、幻觉问题等,也包含其他模型如grok - 3 - beta、Anthropic、Open AI的相关情况,讨论氛围较理性且包含多种观点]

 ·  · 
模型与技术 其他

24GB显存下当前最佳无审查大语言模型

[在寻找24GB VRAM下最佳无审查LLM的讨论中,大家推荐了多种模型并分享使用体验,有对不同模型的评价、问题反馈,整体氛围积极且信息丰富]

 ·  · 
模型与技术 其他

是否存在比Ollama更好的模型

[原帖询问是否有比Ollama更好的东西,评论者们从不同角度进行讨论,推荐了多种替代选项并分析了各自的性能、优缺点等,整体氛围积极且充满技术干货]

 ·  · 
模型与技术 其他

Gemini 2.5 Pro表现失常

[关于Gemini 2.5 Pro的讨论,包括它与其他模型对比表现出色难以被超越、谷歌的领先因素、与Grok的比较、对运行LLM服务盈利的疑问、视频中的提示相关问题以及从代码层面的分析等]

 ·  · 
应用与工具 开发工具与框架

发布轻量级全C++的whisper.cpp桌面UI

[作者发布了一个为whisper.cpp构建的轻量级全C++桌面UI,用户围绕UI展开多方面讨论,包括功能改进、兼容性、商业化等,整体氛围比较积极和谐]

 ·  · 
模型与技术 技术讨论

微软开发RAG与微调结合技术优化领域适应

[原帖分享微软结合RAG和微调的技术,评论者有的分享相关知识或经历,有的对原帖观点表示认可,也有提出异议认为不是新方法,还有人进行相关技术比较并提及其他有前景的技术]

 ·  · 
硬件与部署 其他

深度剖析NVIDIA DGX Station GB300

[围绕NVIDIA DGX Station GB300展开讨论,涉及AMD与NVIDIA的技术对比、GB300的价格推测、对B300芯片的GPU概念理解以及对设备本身的评价等内容,氛围比较理性探讨]

 ·  · 
模型与技术 新模型发布

查询"Qwen 3"有意外发现

[原帖分享关于Qwen 3在DuckDuckGo上搜索发现的有趣内容,评论以幽默诙谐方式调侃其中可能的发布日期,也涉及对相关链接、网站合法性等的讨论,整体氛围轻松幽默]

 ·  · 
模型与技术 新模型发布

今日是否会发布新的Qwen模型?

[围绕Qwen模型的发布展开讨论,涉及已发布版本、新模型发布时间、期待新功能,还有部分关于模型运行的需求以及表述错误等情况,整体氛围积极且充满期待]

 ·  · 
模型与技术 性能对比

Gemma 3的问题出在哪?

[关于Gemma 3存在的各种问题如像受惊仆人、过度道歉、自我重复等展开讨论,涉及系统提示、参数设置等方面的看法,有调侃也有同情,整体氛围较为理性探讨]

 ·  ·