模型与技术

深度探索Deepseek v3：是否优于GPT - 4o和3.5 Sonnet？

[围绕Deepseek v3与GPT - 4o、Claude 3.5 Sonnet等模型在推理、编码、写作等方面的比较，大家看法不一，有肯定也有质疑，同时还涉及到Deepseek v3的成本、数据安全等问题]

[原帖作者构建小型LLM并集成于开源网关引发讨论，包含对模型的赞赏、对技术方面的询问、许可限制相关探讨等，整体氛围积极且充满探索欲]

[帖子关于GAIA基准测试展开讨论，涉及代理技术相关问题、学位与智能的关联、对测试的信任质疑、测试的实际意义等，整体氛围比较理性探讨]

[原帖对Deep Seek v3进行称赞，评论主要围绕Deep Seek v3展开，包括使用体验、遇到的问题、隐私方面的疑问等，氛围较为客观理性]

[该讨论围绕2025年谁将首先发布新模型展开，涉及多种模型如Llama、Qwen等，大家各抒己见，氛围较为积极]

[帖子讨论LLMs是否能在分布外进行多跳推理，Ilya给出较复杂的答案，有人认同有人质疑，还有人分享了参加讲座的感受。]

[围绕DeepSeek V3在llama.cpp上运行展开讨论，包括技术细节、硬件要求、性能表现等多方面内容，整体氛围积极且充满对项目的期待]

[原帖介绍了具有“故事流思维链”的角色扮演AI模型mirau及其特点，评论者们主要围绕模型相关的技术问题、尝试意愿、好奇点和应用设想等进行了低热度讨论]

[围绕是否有开源模型超越ChatGPT4展开讨论，涉及多个模型的性能、参数、推理能力等方面的比较，还有对开源模型的期望、质疑以及硬件需求等内容，整体氛围争议与探讨并存]

[SmallThinker - 3B - Preview发布后，大家普遍持肯定态度并围绕模型特性、使用、测试等多方面展开技术讨论，同时也有少量负面评价。]