模型与技术 训练与微调技术

NSFW Orpheus TTS更新

[原帖发布nsfw orpheus tts更新,评论者们围绕Orpheus的性能、与Zonos的对比、数据情况、模型使用和数据集等方面展开讨论,整体氛围较理性且积极。]

 ·  · 
模型与技术 新模型发布

huihui-ai/QwQ-32B-abliterated表现出色

[原帖推荐huihui - ai/QwQ - 32B - abliterated模型,评论者们分享相关资源、讨论模型的参数设置、性能测试、比较等,整体氛围较为积极]

 ·  · 
模型与技术 技术讨论

QwQ - 32B 128k扩展上下文的llama.cpp参数

[原帖询问llama.cpp在特定模型下扩展上下文的参数设置,评论从测试结果、简化设想、模型失控、性能下降、替代方案等多方面给出回应,整体氛围偏向技术交流探讨]

 ·  · 
模型与技术 技术讨论

微软开发更高效向大语言模型添加知识的方法

[微软开发向LLMs添加知识的更高效方式,引发关于测试可行性、概念成果、知识交互方式、成果实用性、名称准确性等多方面的讨论,氛围以理性探讨为主]

 ·  · 
模型与技术 新模型发布

Gemini 2.5 Pro表现惊艳

[原帖推荐Gemini 2.5 Pro,评论者从使用体验、与其他模型对比等多方面展开讨论,整体对Gemini 2.5 Pro评价积极但也存在部分质疑,氛围热烈且多元]

 ·  · 
模型与技术 其他

Qwen Chat上的新QVQ - Max

[围绕“New QVQ - Max on Qwen Chat”展开讨论,包含对产品状态、未来发展的期待、一些技术相关的疑问等内容,整体氛围比较轻松]

 ·  · 
模型与技术 性能对比

DeepSeek V3 0324在Livebench上超越Claude 3.7

[围绕DeepSeek V3 (0324)在LiveBench上超越Claude 3.7展开讨论,涉及DeepSeek V3的性能下降、幻觉问题等,也包含其他模型如grok - 3 - beta、Anthropic、Open AI的相关情况,讨论氛围较理性且包含多种观点]

 ·  · 
模型与技术 其他

24GB显存下当前最佳无审查大语言模型

[在寻找24GB VRAM下最佳无审查LLM的讨论中,大家推荐了多种模型并分享使用体验,有对不同模型的评价、问题反馈,整体氛围积极且信息丰富]

 ·  · 
模型与技术 其他

是否存在比Ollama更好的模型

[原帖询问是否有比Ollama更好的东西,评论者们从不同角度进行讨论,推荐了多种替代选项并分析了各自的性能、优缺点等,整体氛围积极且充满技术干货]

 ·  · 
模型与技术 其他

Gemini 2.5 Pro表现失常

[关于Gemini 2.5 Pro的讨论,包括它与其他模型对比表现出色难以被超越、谷歌的领先因素、与Grok的比较、对运行LLM服务盈利的疑问、视频中的提示相关问题以及从代码层面的分析等]

 ·  ·