模型与技术 模型更新

Ichigo-llama3.1 v0.4:MMLU得分64.66,多轮对话追踪更佳并拒非语音输入

[围绕Ichigo - llama3.1 v0.4的更新展开讨论,包括其拒绝非语音输入、基于Llama 3.1的模型情况、性能、技术演示中的图片问题以及产品功能受质疑等内容,整体氛围比较平和]

 ·  · 
模型与技术 模型更新

GraphLLM框架更新,新增多特性

[关于GraphLLM的更新,用户讨论了其有用性、应用场景、安装问题,有人认可并打算尝试,还有人提出功能支持相关建议和项目对比相关话题,整体讨论热度较低。]

 ·  · 
模型与技术 模型更新

Qwen 2.5 Coder 7B与1.5B Instruct模型权重更新

[关于Qwen 2.5 Coder 7B和1.5B Instruct模型权重更新无解释这一事件,大家讨论了版本管理、新模型预测、模型性能等话题,整体氛围积极且充满好奇]

 ·  · 
模型与技术 模型更新

Drummer"s Nautilus 70B v0.1:L3.1 Nemotron 70B的RP微调版本

[关于Drummer"s Nautilus 70B v0.1模型,包括其作为首次微调成果发布、存在的问题、与其他模型的比较、硬件配置下的使用、模型性能评估等多方面的讨论,氛围比较平和,主要是分享观点和提出疑问]

 ·  · 
模型与技术 模型更新

扎克伯格:发布量化版Llama 1B和3B设备模型

[该Reddit讨论围绕扎克伯格在Threads上发布Llama 1B和3B量化版本展开,包含对扎克伯格形象、Threads平台的看法,对量化模型技术、性能、使用案例等的讨论,情感倾向正负皆有。]

 ·  · 
模型与技术 模型更新

深入探究Claude的视觉代理计算机使用

[关于Anthropic公司Claude Sonnet 3.5像人类操作计算机的能力,大家从体验、性能、费用、技术改进等多方面展开讨论,有兴奋期待也有质疑不满。]

 ·  · 
模型与技术 模型更新

Mistral-Nemo-12B和Llama-3.1-8B的RPMax创意模型更新

[围绕特定模型展开讨论,涉及模型的各个方面如数据集、性能、更新等,评论者态度有正面期待也有指出问题的,整体氛围较积极且充满探索性]

 ·  · 
模型与技术 模型更新

鼓手之虎Gemma 9B v3模型解禁新法

讨论主要围绕Drummer"s Tiger Gemma 9B v3模型的改进、性能和用户体验展开,涉及AI行为优化、去审查状态及未来微调的不确定性,整体氛围积极但存在对模型局限性的担忧。

 ·  · 
模型与技术 模型更新

Llama 3.2视觉模型图像像素限制揭秘

讨论围绕Llama 3.2 Vision Model的图像像素限制、文件格式支持及其在实际应用中的问题,涉及技术细节、重复信息质疑和AI模型的未来发展。

 ·  · 
模型与技术 模型更新

MLX新增支持Qwen2-VL模型

讨论围绕 MLX 支持的 Qwen2-VL 模型在 Mac 上的使用问题展开,涉及安装、性能、文档和模型兼容性等多个方面。

 ·  ·