模型与技术 新模型发布

Llama 4今年将有多次发布 包含语音与推理功能

[该Reddit讨论围绕Llama 4的多个方面展开,包括模型大小、技术发展、适用性等,有期待、质疑等不同态度,整体氛围活跃且多元]

 ·  · 
模型与技术 新模型发布

构建小型(函数调用)大能力的LLM并集成于开源网关

[原帖作者构建小型LLM并集成于开源网关引发讨论,包含对模型的赞赏、对技术方面的询问、许可限制相关探讨等,整体氛围积极且充满探索欲]

 ·  · 
模型与技术 新模型发布

深爱Deep Seek v3:卓越的AI模型

[原帖对Deep Seek v3进行称赞,评论主要围绕Deep Seek v3展开,包括使用体验、遇到的问题、隐私方面的疑问等,氛围较为客观理性]

 ·  · 
模型与技术 新模型发布

2025年谁将率先发布新模型?

[该讨论围绕2025年谁将首先发布新模型展开,涉及多种模型如Llama、Qwen等,大家各抒己见,氛围较为积极]

 ·  · 
模型与技术 新模型发布

具有"故事流思维链"的角色扮演AI

[原帖介绍了具有“故事流思维链”的角色扮演AI模型mirau及其特点,评论者们主要围绕模型相关的技术问题、尝试意愿、好奇点和应用设想等进行了低热度讨论]

 ·  · 
模型与技术 新模型发布

开源模型Deepseek V3可比肩ChatGPT4

[围绕是否有开源模型超越ChatGPT4展开讨论,涉及多个模型的性能、参数、推理能力等方面的比较,还有对开源模型的期望、质疑以及硬件需求等内容,整体氛围争议与探讨并存]

 ·  · 
模型与技术 新模型发布

SmallThinker - 3B - Preview发布:类o1推理SLM

[SmallThinker - 3B - Preview发布后,大家普遍持肯定态度并围绕模型特性、使用、测试等多方面展开技术讨论,同时也有少量负面评价。]

 ·  · 
模型与技术 新模型发布

2024年12月10日:Cerebras系统与美国能源部桑迪亚国家实验室宣称在单个CS - 3系统上完成1万亿参数模型的训练

[Cerebras Systems和美国能源桑迪亚国家实验室宣称在单个CS - 3系统上训练1万亿参数模型,Reddit用户对此展开多方面讨论,包括性能、成本、技术应用等,整体充满疑问与推测的氛围]

 ·  · 
模型与技术 新模型发布

Together开始托管Deepseek V3:隐私友好的使用方式

[围绕Deepseek V3在together.ai上的使用展开讨论,涉及价格、性能、隐私、技术等多方面,存在诸多疑惑与质疑,整体氛围以理性探讨为主]

 ·  · 
模型与技术 新模型发布

SemiKong:首个开源半导体聚焦大语言模型(基于Llama 3.1构建)

[关于首个开源半导体专注的LLM SemiKong,有介绍其亮点、积极认可的声音,也有对标题风格、项目情况及所基于版本的质疑等多种观点的讨论]

 ·  ·