模型与技术 新模型发布

Claude 3.7 Sonnet与Claude Code

[该讨论围绕Claude 3.7 Sonnet和Claude Code展开,涉及等待相关产品、开源闭源争议、价格比较、成本等方面,有观点分享、疑问提出和使用体验交流,整体氛围较理性]

 ·  · 
模型与技术 新模型发布

QwQ - Max - 即将预览

[原帖介绍QwQ - Max - Preview相关进展,评论者们对其开源表示兴奋、期待,存在对其功能、参数等方面的好奇,也有一些调侃及对发布时间的关注等,整体氛围积极活跃。]

 ·  · 
模型与技术 新模型发布

波兰数字事务部在HF分享PLLuM模型家族

[围绕波兰数字事务部在HF分享PLLuM模型家族这一事件展开讨论,涉及模型的技术特点、项目情况、意义价值等多方面内容,整体氛围较为积极理性]

 ·  · 
模型与技术 新模型发布

近期是否有图像模型发布?

[原帖询问是否有新的图像模型发布,评论围绕Flux能否被认真训练、新模型情况、各模型的优势劣势、成人内容对模型的影响等展开,整体氛围理性讨论为主]

 ·  · 
模型与技术 新模型发布

山姆A何时发布o3 - mini级本地模型

[关于Sam A的o3 - mini级别模型在投票获胜后却无本地发布消息,评论者大多表示不信任Sam A会兑现,也有观点认为需要耐心等待,整体氛围偏消极]

 ·  · 
模型与技术 新模型发布

Llama 4未按时发布,Meta需参与竞争

[围绕Meta未按预期在1月发布Llama 4展开讨论,涉及未发布原因、模型特性、Meta竞争状况等多方面,整体氛围积极且充满各种猜测与分析]

 ·  · 
模型与技术 新模型发布

Ozone AI发布Chirp 3b模型

[围绕Chirp - 3b模型展开讨论,包括资源链接故障与恢复、对特定版本的请求、相关版本补充等,总体氛围平和]

 ·  · 
模型与技术 新模型发布

TIGER - Lab的MMLU - Pro基准测试中神秘RRD2.5 - 9B模型,谁构建的?

[原帖询问神秘的RRD2.5 - 9B模型是谁构建的,评论围绕模型查找无果、对其分数真实性的质疑、MMLU - Pro排行榜可信度、模型相关玩笑以及个人的模型使用体验等展开,整体氛围充满好奇与怀疑。]

 ·  · 
模型与技术 新模型发布

Mistral 24b:可解析且表现出色

[关于Mistral 24b的讨论,涵盖其在不同任务中的表现、与其他模型比较、运行速度、准确性等方面,总体氛围比较多元既有正面评价也有否定观点。]

 ·  · 
模型与技术 新模型发布

阿里国际数字商业集团推出Ovis2多模态大模型(1B - 34B)

[关于阿里巴巴国际数字商务集团的Ovis2多模态大语言模型,大家主要讨论其模型性能,如1B模型在OCR测试、识别能力方面的表现,还有模型的本地运行、转换、兼容性等问题,整体讨论热度参差不齐。]

 ·  ·