模型与技术 新模型发布

大卫·奥(DavidAU)发布三个新模型

[原帖介绍了三个新模型,评论主要围绕模型性能、表现、特定模型存在与否、使用反馈、未发布情况以及运行相关的问题展开,整体氛围较技术向]

 ·  · 
模型与技术 新模型发布

Qwen2.5 - Coder将推出0.5B、3B、14B和32B版本

[围绕Qwen2.5 - Coder不同尺寸展开讨论,涉及模型性能、硬件需求、版本发布等多方面内容,整体氛围积极且充满探索性]

 ·  · 
模型与技术 新模型发布

OpenCoder:性能媲美顶级代码语言模型的开源可复现代码语言模型家族

[关于OpenCoder这个开源代码语言模型,大家从架构、性能、上下文长度、评估方式等多方面进行讨论,既有对其积极的期待,也有对它能力的质疑,总体氛围是理性探讨]

 ·  · 
模型与技术 新模型发布

Meta新模型fractal_alpha体验与初步测评

[围绕fractal_alpha模型展开讨论,包括对其性能测试、来源猜测、出现的问题如创造者信息混乱等,还有对模型回复内容引发的争议,整体氛围以探究为主]

 ·  · 
模型与技术 新模型发布

微软悄然发布用于解决复杂任务的开源多智能体系统Magentic - One及AutogenBench

[微软悄悄发布“Magentic - One”和“AutogenBench”引发讨论,话题包括系统代理行为、开源性、技术特性、与其他产品关系、存在的问题以及发布方式等,整体氛围较为多元,有好奇、质疑等多种情绪]

 ·  · 
模型与技术 新模型发布

Qwen 2.5登上官方LiveCodeBench排行榜

[围绕Qwen 2.5在官方排名表中的表现展开讨论,包含对其惊叹、疑惑、期待等多种态度,同时涉及其他模型性能、排名、使用情况等多方面内容]

 ·  · 
模型与技术 新模型发布

新型超小语言模型:Wave网络

[关于Wave Network这一超小语言模型的帖子引发多方面讨论,包括对模型的理解、其革命性意义、模型大小影响、量子计算关联等,整体氛围理性且多元]

 ·  · 
模型与技术 新模型发布

LLM竞技场惊现神秘新模型

[围绕LLM Arena新神秘模型(涉及Android开发相关代码等内容)展开讨论,包括模型好坏、是否会被揭示、模型身份猜测等多方面内容,整体氛围疑惑好奇并存]

 ·  · 
模型与技术 新模型发布

腾讯推出389B MoE开源权重模型

[腾讯发布389B MoE模型引发诸多讨论,包括模型本身性能、参数、与其他模型比较,运行所需硬件资源和适配设备,还有欧盟监管相关,讨论氛围积极且充满技术探讨氛围]

 ·  · 
模型与技术 新模型发布

腾讯推出强大模型

[腾讯发布模型引发讨论,包括对模型本身的期待与评价、中国公司面临无端指责、腾讯在创新中的地位等,整体氛围积极且多元。]

 ·  ·