模型与技术 新模型发布

QwenPhi - 4 - 0.5b - Draft相关资源

[围绕QwenPhi - 4 - 0.5b - Draft展开讨论,涉及模型的性质、使用、性能、相关资源等,氛围积极友好,有技术交流也有赞赏认可]

 ·  · 
模型与技术 新模型发布

扩散语言模型是否有未来?

[围绕扩散语言模型是否有未来展开讨论,涉及与自回归模型对比、性能、应用场景等多方面因素,大家观点不一,氛围较理性客观。]

 ·  · 
模型与技术 新模型发布

使用Gemini-2.5-pro-exp-03-25模型30分钟未想念Claude

[原帖分享使用gemini - 2.5 - pro - exp - 03 - 25模型30分钟后不想念Claude的体验,评论者们围绕gemini2.5 pro表达了满意、好奇,也有人质疑其在特定板块出现的合理性,还有人指出该模型存在的问题,整体氛围较为多元]

 ·  · 
模型与技术 新模型发布

Qwen-2.5-72b成最佳开源OCR模型

[围绕Qwen - 2.5 - 72b是否为最佳开源OCR模型展开讨论,涉及模型更新、性能、多语言评估等方面,存在质疑与肯定的不同声音]

 ·  · 
模型与技术 新模型发布

字节跳动发布新的语音合成(TTS)模型

[字节跳动新的TTS模型引发讨论,涉及语音克隆功能、安全理由、商业策略、伦理矛盾以及模型自身特性等方面,整体氛围以质疑为主]

 ·  · 
模型与技术 新模型发布

huihui-ai/QwQ-32B-abliterated表现出色

[原帖推荐huihui - ai/QwQ - 32B - abliterated模型,评论者们分享相关资源、讨论模型的参数设置、性能测试、比较等,整体氛围较为积极]

 ·  · 
模型与技术 新模型发布

Gemini 2.5 Pro表现惊艳

[原帖推荐Gemini 2.5 Pro,评论者从使用体验、与其他模型对比等多方面展开讨论,整体对Gemini 2.5 Pro评价积极但也存在部分质疑,氛围热烈且多元]

 ·  · 
模型与技术 新模型发布

查询"Qwen 3"有意外发现

[原帖分享关于Qwen 3在DuckDuckGo上搜索发现的有趣内容,评论以幽默诙谐方式调侃其中可能的发布日期,也涉及对相关链接、网站合法性等的讨论,整体氛围轻松幽默]

 ·  · 
模型与技术 新模型发布

今日是否会发布新的Qwen模型?

[围绕Qwen模型的发布展开讨论,涉及已发布版本、新模型发布时间、期待新功能,还有部分关于模型运行的需求以及表述错误等情况,整体氛围积极且充满期待]

 ·  · 
模型与技术 新模型发布

深度探索Deepseek v3 0324:国内的Sonnet 3.5

[原帖讨论Deepseek v3 0324模型的能力并与Claude 3.5 Sonnet比较,评论围绕模型运行的硬件、成本、性能、推理能力等多方面展开,氛围较理性且有不同观点交流]

 ·  ·