模型与技术 模型更新

Qwq - 32b在Livebench上完成更新

[关于Qwq - 32b更新Livebench的讨论涉及模型比较、基准测试、本地运行等多方面,大家分享使用体验、对不同模型能力进行评价并对一些结果表示质疑,整体氛围活跃且充满观点碰撞]

 ·  · 
模型与技术 模型更新

Livrbench - 明日qwq32b将更新至score?

[围绕Livrbench中qwq32b的更新得分展开讨论,涉及qwq的不兼容、配置问题等,对排行榜结果是否调整也表示好奇,总体氛围较为理性且探讨氛围浓厚]

 ·  · 
模型与技术 模型更新

Meta AI何时迎来Llama升级

[原帖询问Meta AI的Llama版本何时升级,评论围绕Llama版本目前的停滞状态、可能的升级时间、Meta AI与其他竞品的关系、股东利益以及是否应免费升级等展开,整体氛围充满对Llama升级的期待与猜测。]

 ·  · 
模型与技术 模型更新

Phi-4 - mini的漏洞修复与GGUFs

[原帖发布Phi - 4 - mini的Bug修复及相关资源,评论围绕模型发布错误、对技术方面的疑惑、表示感谢等展开,氛围较为积极且充满技术探讨]

 ·  · 
模型与技术 模型更新

PerplexityAI发布R1-1776:深度寻求R1微调版,去除中国审查并保持推理能力

[围绕PerplexityAI发布的R1 - 1776模型,讨论涉及审查制度、模型特性、偏见、中美差异等多方面,氛围争议性强且观点多样]

 ·  · 
模型与技术 模型更新

我的模型在Hugging Face上成为热门,我推出14B和7B升级版

[原帖分享UIGEN - T1.1模型升级,评论者围绕模型相关的各种话题展开讨论,如性能改进、数据集查看、技术操作困难等,整体氛围积极且充满建设性。]

 ·  · 
模型与技术 模型更新

KTransformers v0.2.1:针对DeepSeek - V3/R1 - q4,将上下文从4K扩展到8K(24GB VRAM)且速度略增(+15%)

[KTransformers v0.2.1发布相关的讨论,包含技术支持、性能、硬件等方面的疑问、观点和期待,整体氛围积极且充满探索性]

 ·  · 
模型与技术 模型更新

Drummer的Cydonia 24B v2:Mistral Small 2501的RP微调版本

[围绕名为Drummer"s Cydonia 24B v2的模型,大家表现出期待、兴趣,讨论包括链接访问、内容创作、预设分享、模型功能等多方面话题,整体氛围较为积极活跃]

 ·  · 
模型与技术 模型更新

发布我的首个模型LlamaThink - 8B

[原帖发布LlamaThink - 8B模型,大家的讨论围绕模型分享展开,包括请求示例输出、询问模型相关技术细节、分享经验、提出对比测试等,整体氛围积极和谐]

 ·  · 
模型与技术 模型更新

修剪后的Phi-4模型及其不安全因素

[原帖介绍了对Phi - 4进行修剪后的Phi - Lthy4,评论围绕模型相关话题展开,包括与其他模型比较、运行硬件需求、资源获取等,氛围比较轻松,有幽默元素]

 ·  ·