模型与技术 新模型发布

DeepSeek V3聊天版权重已上传至Huggingface

[围绕Deepseek V3 Chat版本权重上传至Huggingface展开讨论,包含对其技术层面如分片、模型规模的惊叹,也有幽默调侃,还涉及Elon Musk相关话题,以及对Deepseek V3 Chat运行相关的疑问和讨论]

 ·  · 
模型与技术 性能对比

智能体集群框架在空间推理测试中表现出色

[关于Agent swarm framework在空间推理测试中的表现,评论从幽默调侃到理性探讨,有对蚂蚁相关话题的讨论,也有对框架本身的疑问、认可和质疑等,整体氛围轻松多元]

 ·  · 
模型与技术 新模型发布

DeepSeek V3模型现身Hugging Face平台

[围绕DeepSeek V3展开多方面讨论,包括技术参数、硬件需求等,同时夹杂着幽默调侃和对其运行的期待等不同情感]

 ·  · 
模型与技术 性能对比

DeepSeek V3在LiveBench上的基准测试结果

[原帖给出DeepSeek V3的基准测试结果,评论围绕DeepSeek V3的性能、排名、推理能力、运行硬件、与其他模型对比等展开讨论,整体氛围积极且多元]

 ·  · 
模型与技术 性能对比

Deepseek v3在aider上超越Claude sonnet

[围绕Deepseek v3在aider上打败Claude sonnet这一事件展开讨论,涉及谷歌前CEO对中国AI看法的转变、对Deepseek v3的肯定、对Gemini 1206的疑问以及从Claude到Deepseek的态度转变等内容,整体氛围较为理性]

 ·  · 
模型与技术 新模型发布

深擎v3 API已上线

[围绕deepseekv3 API已上线这一事件展开讨论,涉及API运行期待、模型性能参数、速度、编码能力等多方面内容,整体氛围积极且充满技术探讨氛围]

 ·  · 
模型与技术 新模型发布

DeepSeek V3模型在Huggingface上的模型卡

[围绕DeepSeek V3模型在Huggingface上的模型卡展开讨论,包括模型的性能、资源需求、与其他模型比较等内容,整体氛围积极和谐]

 ·  · 
模型与技术 新模型发布

Deepseek V3已上线

[Deepseek V3上线,引发关于其参数规模、版本发布、开源情况、性能表现等多方面的讨论,整体氛围积极且充满期待,同时也存在一些疑惑与质疑。]

 ·  · 
模型与技术 新模型发布

高山LLaMA:GPU和磁盘空间不足者的福音

[关于Alpine LLaMA项目,大家从不同角度展开讨论,包括项目融合、技术实现、功能支持、适用性等方面,整体氛围较为理性探讨]

 ·  · 
模型与技术 新模型发布

Qwen新发布

[围绕Qwen发布展开多方面讨论,包括模型性能、开源情况、图像识别相关,以及一些技术问答和节日祝福等,氛围积极且充满好奇]

 ·  ·