新模型发布

Llama 4今年将有多次发布包含语音与推理功能

[该Reddit讨论围绕Llama 4的多个方面展开，包括模型大小、技术发展、适用性等，有期待、质疑等不同态度，整体氛围活跃且多元]

[原帖作者构建小型LLM并集成于开源网关引发讨论，包含对模型的赞赏、对技术方面的询问、许可限制相关探讨等，整体氛围积极且充满探索欲]

[原帖对Deep Seek v3进行称赞，评论主要围绕Deep Seek v3展开，包括使用体验、遇到的问题、隐私方面的疑问等，氛围较为客观理性]

[该讨论围绕2025年谁将首先发布新模型展开，涉及多种模型如Llama、Qwen等，大家各抒己见，氛围较为积极]

[原帖介绍了具有“故事流思维链”的角色扮演AI模型mirau及其特点，评论者们主要围绕模型相关的技术问题、尝试意愿、好奇点和应用设想等进行了低热度讨论]

[围绕是否有开源模型超越ChatGPT4展开讨论，涉及多个模型的性能、参数、推理能力等方面的比较，还有对开源模型的期望、质疑以及硬件需求等内容，整体氛围争议与探讨并存]

[SmallThinker - 3B - Preview发布后，大家普遍持肯定态度并围绕模型特性、使用、测试等多方面展开技术讨论，同时也有少量负面评价。]

[Cerebras Systems和美国能源桑迪亚国家实验室宣称在单个CS - 3系统上训练1万亿参数模型，Reddit用户对此展开多方面讨论，包括性能、成本、技术应用等，整体充满疑问与推测的氛围]

[围绕Deepseek V3在together.ai上的使用展开讨论，涉及价格、性能、隐私、技术等多方面，存在诸多疑惑与质疑，整体氛围以理性探讨为主]

[关于首个开源半导体专注的LLM SemiKong，有介绍其亮点、积极认可的声音，也有对标题风格、项目情况及所基于版本的质疑等多种观点的讨论]