模型与技术 新模型发布

Qwen发布Qwen/Qwen2.5 - Omni - 7B

[Qwen/Qwen2.5 - Omni - 7B发布后,Reddit用户对其进行了多方面讨论,包括模型评测、多模态整合、语音功能、语言支持等,有肯定也有指出不足的声音。]

 ·  · 
模型与技术 性能对比

DeepSeek - V3在M3 Ultra 512GB上4位量化每秒处理超20k个词元且功耗低于200瓦

[关于DeepSeek - V3在消费级硬件(如M3 Ultra)上运行的话题,大家从模型性能、速度、硬件相关等多方面进行讨论,存在不同观点且争议较大,整体氛围理性且技术向]

 ·  · 
模型与技术 新模型发布

InclusionAI发布Ling系列新模型

[对Ling系列模型的讨论涉及性能、制作方式、比较合理性等多方面,有提问、质疑、建议等不同观点,整体氛围理性客观]

 ·  · 
模型与技术 性能对比

Gemini 2.5 Pro Exp 03 - 25在Livebench中排名第一

[关于gemini - 2.5 - pro - exp - 03 - 25在Livebench排名第一的帖子引发了多方面讨论,包括模型的来源推测、模型能力评估、付费与使用权限、免费资源的请求次数限制等内容,讨论氛围热烈且存在多种观点的交锋]

 ·  · 
模型与技术 新模型发布

Gemini 2.5 Pro构建巨型结构:一次性完成

[围绕Gemini 2.5 Pro制作的巨型结构展开讨论,包括对其用途、制作方式、代码生成等方面的疑问,有否定和不满的声音,也存在幽默调侃和创意联想等情况]

 ·  · 
模型与技术 性能对比

开源中的多模态目前很糟糕

[原帖认为开源多模态大语言模型目前糟糕,各公司难以复制OpenAI或Gemini成功,评论者从不同角度阐述开源多模态模型现状、未来、存在的问题等,有多种观点碰撞,整体氛围理性讨论]

 ·  · 
模型与技术 性能对比

DeepSeek-V3.1官方实时评测分数与本地测试结果不匹配

[原帖提出DeepSeek - V3.1官方Livebench分数与本地测试结果不匹配,评论者从官方设置、数据公开情况、技术差异等方面进行讨论,整体氛围较理性平和]

 ·  · 
模型与技术 其他

Deepseek v3相关信息

[围绕Deepseek v3和OpenAI展开讨论,涉及模型性能、成本、多模态等多方面内容,观点多元且有争议,整体氛围活跃。]

 ·  · 
模型与技术 性能对比

Deepseek V3 0324被评为最佳非推理模型

[围绕Deepseek V3 0324成为最佳非推理模型展开讨论,涉及模型比较、基准测试、Llama模型现状等多方面内容,有赞同也有质疑,氛围较理性]

 ·  · 
模型与技术 新模型发布

Gemini 2.5 Pro实验版发布且称霸基准测试

[围绕Gemini 2.5展开讨论,涉及应用推出问题、模型性能、数据隐私等多方面,观点有正面期待也有负面质疑,氛围较为热烈]

 ·  ·