模型与技术 新模型发布

Qwen2.5 - VL发布

[Qwen2.5 - VL发布引发讨论,涵盖模型类型、性能对比、本地使用等方面,整体氛围较为平静专注]

 ·  · 
模型与技术 新模型发布

Janus - Pro - 7B首次测试

[围绕Janus - Pro - 7B首次测试展开讨论,有对测试结果的差评、好评,也有对模型性质的探讨和与其他模型的比较]

 ·  · 
模型与技术 新模型发布

DeepSeek发布新多模态理解与视觉生成模型Janus - Pro 7B

[DeepSeek发布新模型Janus - Pro 7B引发多种讨论,包括模型运行、与其他项目关系,还涉及地缘政治相关争议等内容,整体氛围较复杂。]

 ·  · 
模型与技术 新模型发布

Qwen2.5 - 1M在HuggingFace发布:支持百万标记上下文长度

[Qwen2.5 - 1M发布后,网友围绕其性能、显存需求、在不同硬件上的表现、实用性等多方面展开讨论,整体氛围积极且充满技术探讨氛围]

 ·  · 
模型与技术 新模型发布

Qwen 2.5 VL即将发布?

[围绕Qwen2.5 VL即将发布展开讨论,涉及模型发布情况、显存需求、模型功能、存在的问题等多方面,既有正面评价也有质疑,整体氛围较积极且充满期待]

 ·  · 
模型与技术 新模型发布

网易有道推出Confucius - o1 - 14B推理模型

[围绕Confucius - o1 - 14B模型展开讨论,包括其性能、测试情况、与其他模型比较等,整体氛围积极且充满兴趣]

 ·  · 
模型与技术 新模型发布

中国联通发布Unichat - 32B - c1(超越GPT - 4和Deepseek V3)

[中国联通宣布Unichat - 32B - c1相关模型,引发关于模型基础、表现、目的、企业角色等多方面讨论,氛围理性且有一定争议]

 ·  · 
模型与技术 新模型发布

阿里巴巴发布Qwen2.5系列新模型

[Qwen2.5系列新模型发布后,评论者们整体持积极态度,表达了对Qwen的感谢、期待、认可,也存在对模型技术相关如量化、显存需求、CPU推理、模型使用等方面的讨论和疑问]

 ·  · 
模型与技术 新模型发布

Qwen 2.5 VL即将到来

[围绕Qwen 2.5 VL即将到来展开讨论,包括其在视觉相关领域的应用前景、性能期待、模型微调相关话题、不同版本的情况以及在文档表格处理中的应用等,整体氛围积极向上]

 ·  · 
模型与技术 新模型发布

百川智能推出针对医疗场景优化的Baichuan-14B-M1

[围绕Baichuan - M1 - 14B模型,有对其数据来源、基准分数等的质疑,也有对其在医疗训练方面的积极期待和尝试意愿]

 ·  ·