模型与技术 性能对比

深度探索Deepseek v3:是否优于GPT - 4o和3.5 Sonnet?

[围绕Deepseek v3与GPT - 4o、Claude 3.5 Sonnet等模型在推理、编码、写作等方面的比较,大家看法不一,有肯定也有质疑,同时还涉及到Deepseek v3的成本、数据安全等问题]

 ·  · 
模型与技术 新模型发布

构建小型(函数调用)大能力的LLM并集成于开源网关

[原帖作者构建小型LLM并集成于开源网关引发讨论,包含对模型的赞赏、对技术方面的询问、许可限制相关探讨等,整体氛围积极且充满探索欲]

 ·  · 
模型与技术 性能对比

GAIA基准下顶尖智能体距有学位人类仅差27%

[帖子关于GAIA基准测试展开讨论,涉及代理技术相关问题、学位与智能的关联、对测试的信任质疑、测试的实际意义等,整体氛围比较理性探讨]

 ·  · 
模型与技术 新模型发布

深爱Deep Seek v3:卓越的AI模型

[原帖对Deep Seek v3进行称赞,评论主要围绕Deep Seek v3展开,包括使用体验、遇到的问题、隐私方面的疑问等,氛围较为客观理性]

 ·  · 
模型与技术 新模型发布

2025年谁将率先发布新模型?

[该讨论围绕2025年谁将首先发布新模型展开,涉及多种模型如Llama、Qwen等,大家各抒己见,氛围较为积极]

 ·  · 
模型与技术 其他

LLMs的离群泛化多跳推理能力探讨

[帖子讨论LLMs是否能在分布外进行多跳推理,Ilya给出较复杂的答案,有人认同有人质疑,还有人分享了参加讲座的感受。]

 ·  · 
模型与技术 其他

DeepSeek V3在llama.cpp上运行,贺新年

[围绕DeepSeek V3在llama.cpp上运行展开讨论,包括技术细节、硬件要求、性能表现等多方面内容,整体氛围积极且充满对项目的期待]

 ·  · 
模型与技术 新模型发布

具有"故事流思维链"的角色扮演AI

[原帖介绍了具有“故事流思维链”的角色扮演AI模型mirau及其特点,评论者们主要围绕模型相关的技术问题、尝试意愿、好奇点和应用设想等进行了低热度讨论]

 ·  · 
模型与技术 新模型发布

开源模型Deepseek V3可比肩ChatGPT4

[围绕是否有开源模型超越ChatGPT4展开讨论,涉及多个模型的性能、参数、推理能力等方面的比较,还有对开源模型的期望、质疑以及硬件需求等内容,整体氛围争议与探讨并存]

 ·  · 
模型与技术 新模型发布

SmallThinker - 3B - Preview发布:类o1推理SLM

[SmallThinker - 3B - Preview发布后,大家普遍持肯定态度并围绕模型特性、使用、测试等多方面展开技术讨论,同时也有少量负面评价。]

 ·  ·