模型与技术 模型更新

QwQ模型被微调后不再审查

[围绕QwQ模型展开讨论,包括其微调、智能、回答、使用体验等方面,有不同观点,整体氛围活跃且充满探索性]

 ·  · 
模型与技术 模型更新

KoboldCpp 1.79发布:多项新功能更新

[KoboldCpp 1.79发布带来功能更新,用户总体持积极态度,部分有技术疑问和功能探讨]

 ·  · 
模型与技术 模型更新

Beepo-22B:基于Mistral Small微调的无审查模型

[围绕Beepo - 22B模型展开多方面讨论,包括与其他模型比较、性能、无审查特性等,氛围较为理性且讨论方向多元]

 ·  · 
模型与技术 模型更新

Qwen 2.5 Coder与128K上下文窗口GGUFs的漏洞修复

[原帖介绍Qwen 2.5模型的Bug修复、版本改进等内容,评论者们围绕模型相关技术如工具调用、上下文窗口、微调等进行讨论,还表达了对原帖作者的感谢与认可,整体氛围积极且技术交流为主]

 ·  · 
模型与技术 模型更新

Ichigo-llama3.1 v0.4:MMLU得分64.66,多轮对话追踪更佳并拒非语音输入

[围绕Ichigo - llama3.1 v0.4的更新展开讨论,包括其拒绝非语音输入、基于Llama 3.1的模型情况、性能、技术演示中的图片问题以及产品功能受质疑等内容,整体氛围比较平和]

 ·  · 
模型与技术 模型更新

GraphLLM框架更新,新增多特性

[关于GraphLLM的更新,用户讨论了其有用性、应用场景、安装问题,有人认可并打算尝试,还有人提出功能支持相关建议和项目对比相关话题,整体讨论热度较低。]

 ·  · 
模型与技术 模型更新

Qwen 2.5 Coder 7B与1.5B Instruct模型权重更新

[关于Qwen 2.5 Coder 7B和1.5B Instruct模型权重更新无解释这一事件,大家讨论了版本管理、新模型预测、模型性能等话题,整体氛围积极且充满好奇]

 ·  · 
模型与技术 模型更新

Drummer"s Nautilus 70B v0.1:L3.1 Nemotron 70B的RP微调版本

[关于Drummer"s Nautilus 70B v0.1模型,包括其作为首次微调成果发布、存在的问题、与其他模型的比较、硬件配置下的使用、模型性能评估等多方面的讨论,氛围比较平和,主要是分享观点和提出疑问]

 ·  · 
模型与技术 模型更新

扎克伯格:发布量化版Llama 1B和3B设备模型

[该Reddit讨论围绕扎克伯格在Threads上发布Llama 1B和3B量化版本展开,包含对扎克伯格形象、Threads平台的看法,对量化模型技术、性能、使用案例等的讨论,情感倾向正负皆有。]

 ·  · 
模型与技术 模型更新

深入探究Claude的视觉代理计算机使用

[关于Anthropic公司Claude Sonnet 3.5像人类操作计算机的能力,大家从体验、性能、费用、技术改进等多方面展开讨论,有兴奋期待也有质疑不满。]

 ·  ·