Posts

DeepSeek V3 0324在Livebench上超越Claude 3.7

[围绕DeepSeek V3 (0324)在LiveBench上超越Claude 3.7展开讨论，涉及DeepSeek V3的性能下降、幻觉问题等，也包含其他模型如grok - 3 - beta、Anthropic、Open AI的相关情况，讨论氛围较理性且包含多种观点]

[Reddit用户分享在3060显卡上使用的模型、用途及相关体验，整体氛围积极且充满干货]

[微软开发向LLMs添加知识的更高效方式，引发关于测试可行性、概念成果、知识交互方式、成果实用性、名称准确性等多方面的讨论，氛围以理性探讨为主]

[关于Gemini 2.5 Pro的讨论，包括它与其他模型对比表现出色难以被超越、谷歌的领先因素、与Grok的比较、对运行LLM服务盈利的疑问、视频中的提示相关问题以及从代码层面的分析等]

[围绕GPT4o图像生成器和Gemini Flash工作原理及特定领域复用展开讨论，包含多种猜测、解答、推荐等，氛围积极且充满探索欲]

[关于Gemma 3存在的各种问题如像受惊仆人、过度道歉、自我重复等展开讨论，涉及系统提示、参数设置等方面的看法，有调侃也有同情，整体氛围较为理性探讨]

[原帖作者计划构建工作站，分享了自己的配置并在自己的配置和Mac M3 ultra mac studio之间纠结，评论者从硬件、系统、模型运行等方面给出看法和建议，整体氛围比较和谐]

[楼主分享M4版MacBook Air的基准测试结果，部分人对性能表示肯定，其他人提出有关测试模型、配置、补充测试等各种疑问，整体氛围积极交流探讨]

[围绕Gemini 2.5 Pro制作的巨型结构展开讨论，包括对其用途、制作方式、代码生成等方面的疑问，有否定和不满的声音，也存在幽默调侃和创意联想等情况]

[OpenAI宣布支持MCP引发了诸多讨论，包括对MCP的理解、与本地的关系、对OpenAI此举目的的质疑以及认可等不同观点，氛围较为多元且存在争议。]