模型与技术 新模型发布

LLMs发展迅猛,新时代将至

[原帖感慨LLMs发展迅速,评论者们从不同角度如自身应用体验、技术限制、发展对比等表达对LLMs发展的看法,整体氛围积极乐观]

 ·  · 
模型与技术 新模型发布

当前14b左右的最佳模型有哪些?

[围绕当前14b左右最佳模型展开讨论,涉及多种模型推荐、比较以及性能评价,整体氛围积极交流]

 ·  · 
模型与技术 新模型发布

llama.cpp支持Llama-3_1-Nemotron-51B

[原帖发布llama.cpp支持Llama - 3_1 - Nemotron - 51B的消息,评论者有表达兴奋、感谢的,也有提及模型相关技术更新、开发、特性、比较等内容,还有一些如硬件需求、首次使用遇到问题等其他话题的讨论]

 ·  · 
模型与技术 新模型发布

Phi - 4通用版本发布情况

[原帖询问微软宣称周末于HF发布的Phi - 4未发布且无消息,评论围绕Phi - 4的发布情况展开,有调侃、推测未发布原因、提供相关信息等多种观点,整体氛围较疑惑且夹杂失望情绪]

 ·  · 
模型与技术 新模型发布

根据LLM密集化规律,2025年10月或将出现8B参数的类GPT - 4o大模型

[原帖对2025年10月可能出现8B参数达到GPT - 4o等级的LLM进行预测,评论者们从模型性能、参数、发展趋势、预训练等多方面展开讨论,有赞同、质疑等不同态度,整体氛围积极且充满探索性]

 ·  · 
模型与技术 新模型发布

Drummer发布Anubis 70B v1:基于Llama 3.3 RP微调

[围绕Drummer"s Anubis 70B v1模型展开讨论,包括模型性能、评估、角色扮演方面的观点,还有关于智能手机运行模型以及对模型命名政策、是否支持ERP的疑问等内容,整体氛围比较积极多元]

 ·  · 
模型与技术 新模型发布

phi4即将发布

[关于phi4在哪里的问题,讨论涵盖phi4已发布但未在Hugging Face正式发布、其在微软Azure AI Foundry发布、性能表现、运行状态、官方不上传原因等多方面内容,整体氛围较积极且充满技术探讨,但也有个别负面态度]

 ·  · 
模型与技术 新模型发布

Llama 3.3 70B指令版删减版(去审查)发布

[围绕Llama 3.3 (70B) instruct ablated版本展开讨论,涉及模型的能力、审查相关、版本差异等多方面话题,讨论氛围较为理性且有探索性]

 ·  · 
模型与技术 新模型发布

实用小型大语言模型推荐

[帖子询问不同规模下小型语言模型的推荐及理由,评论者们从各自的使用场景出发推荐了不同的模型,并阐述了模型在不同任务中的表现,整体讨论氛围积极且具有参考价值。]

 ·  · 
模型与技术 新模型发布

OpenAI发布O3和O3 mini

[Reddit用户对OpenAI宣布O3和O3 mini展开多方面讨论,包括商标、模型性能、AGI进展、成本、发布时间等,观点有正面期待也有怀疑否定,整体氛围热烈且争议性强]

 ·  ·