DeepSeek - V3 - 0324更新日志
[围绕DeepSeek - V3 - 0324展开讨论,包括其发展情况、测试评价、得分期待、对API使用模型版本的质疑以及模型推理能力相关的探讨,整体氛围较为理性和专业]
[围绕DeepSeek - V3 - 0324展开讨论,包括其发展情况、测试评价、得分期待、对API使用模型版本的质疑以及模型推理能力相关的探讨,整体氛围较为理性和专业]
[围绕Google声称Gemini 2.5超越其他思维模型展开讨论,有对其优势的肯定也有诸多质疑,整体氛围充满争议]
[该讨论围绕New DeepSeek V3和Gemini 2.5 Pro长情境测试展开,涉及模型准确率、测试基准、模型价值等多方面观点,整体氛围理性且多元]
[围绕DeepSeek - V3 - 0324 HF模型卡更新展开讨论,涉及模型温度默认值改变的争议、与OpenAI的比较、模型改进、使用成本、写作风格等多个话题,氛围有争议也有积极评价]
[围绕标题中的$150 Phi - 4 Q4 server展开讨论,包括电脑硬件相关的重新利用成本、Phi - 4的性能表现、性价比等方面,有赞同也有反对的声音,还存在一些疑问和技术比较]
[围绕AMD将Strix Halo带到桌面端这一消息展开讨论,涉及硬件配置、性能、价格等多方面,有期待、质疑等不同态度]
[关于Qwen相关产品发布后的讨论,涉及推测新发布版本、性能比较、产品使用、对发布内容的期待与怀疑等多方面,整体氛围有好奇、期待也有怀疑]
[原帖认为注意力、规模和强化学习就能达到人类水平代理性能,评论中有人赞同、有人反对,还讨论了Transformer的问题、人类与LLMs对比、泛化能力等话题,氛围比较热烈且充满争议]
[围绕Deepseek V3 0324在SWE - Bench中获得38.8%这一事件展开讨论,涉及模型分数对比、不同模型组合的看法、模型性能评估、来源提供等,讨论氛围较理性平和]
[围绕One shot website (DeepSeek V3.1)展开讨论,涉及与Claude 3.7对比、网站使用的技术、对工作的影响等多方面内容,氛围较为积极活跃]