模型与技术 新模型发布

用Qwen2.5 - Coder 32b编写基本的chip8模拟器

[原帖介绍用Qwen2.5 - Coder 32b编写的基本chip8模拟器,评论中有人好奇相关系统问题,有人炫耀自己成果,还有人对模拟器的功能和创新性提出质疑等]

 ·  · 
模型与技术 新模型发布

Aider排行榜上的新Qwen模型!

[关于Qwen模型在Aider排行榜上的表现及相关图表引发了一系列讨论,包括模型性能比较、运行要求、应用范围等,同时夹杂着一些对新模型的期待和技术方面的疑问,整体氛围比较积极且富有技术探讨性]

 ·  · 
模型与技术 新模型发布

Qwen/Qwen2.5 - Coder - 32B - Instruct模型于Hugging Face发布

[围绕Qwen - 2.5 - Coder - 32B - Instruct展开讨论,涉及模型性能、与其他模型对比、商业竞争、设备需求等多方面内容,整体氛围积极且充满探索性]

 ·  · 
模型与技术 新模型发布

MIT团队利用8B大语言模型结合测试时训练在ARC - AGI - PUB上得分达61.9%

[帖子围绕MIT团队建立的模型在ARC - AGI - PUB上取得高分展开讨论,涉及人工智能发展方向、模型相关技术探讨、成果的质疑与认可等多方面内容,讨论氛围热烈且富有深度。]

 ·  · 
模型与技术 新模型发布

AlphaFold 3模型代码与权重可供学术使用

[关于Alphafold3模型代码和权重可供学术使用,大家讨论了谷歌的贡献、开源的影响、版权保护问题、使用限制、运行的硬件要求,氛围较为积极且充满好奇]

 ·  · 
模型与技术 新模型发布

Qwen 2.5 Coder 32B可在HuggingChat免费使用

[Qwen 2.5 Coder 32B在HuggingChat免费可用引发讨论,包括模型的性能、资金来源、运行情况等,整体氛围积极且充满好奇]

 ·  · 
模型与技术 新模型发布

期待Qwen 2.5 32b,虽需临时抱佛脚

[该帖子围绕计算机硬件设备展开讨论,涉及显卡、硬件配置等多方面,有技术探讨、设备分享,整体氛围较为积极和谐]

 ·  · 
模型与技术 新模型发布

Qwen - Coder的下一步计划

[关于Qwen - Coder的讨论,涉及商业策略、开源闭源、产品商业化等多方面,有观点认为其存在商业策略,也有对其能否成功及之前言论的怀疑,氛围较为理性探讨。]

 ·  · 
模型与技术 新模型发布

谁将发布下一个有趣的模型?

[原帖询问谁将发布下一个有趣的模型,评论中大家提及各自期待的模型,如Mistral、Gemma等,同时也对不同公司的模型发布策略、模型表现等进行了讨论,整体氛围积极热烈]

 ·  · 
模型与技术 新模型发布

LMSYS新匿名大语言模型:蓝莓

[围绕新的匿名LLM“blueberry”展开多方面讨论,包括模型相关推测、对LLMs进步的看法、对展示内容的调侃等,整体氛围比较多元]

 ·  ·