模型与技术 新模型发布

INTELLECT - 1发布(指令+基础版):首个协同训练模型

[围绕INTELLECT - 1发布展开讨论,涉及模型评估、训练相关话题、对比其他模型、对其存在不同评价以及BitNet相关探讨等,氛围有积极肯定也有质疑批判]

 ·  · 
模型与技术 新模型发布

11月重大人工智能事件

[原帖总结11月重大AI事件,评论围绕事件本身、报道方式、模型特性、资讯获取等方面展开,整体氛围积极且充满探索性]

 ·  · 
模型与技术 新模型发布

Vercel的AI组件生成器v0泄露的系统提示

[v0组件生成工具系统提示泄露引发讨论,包括对其新功能、系统提示特征的看法,有积极期待、惊讶的情绪,也存在对指令和性能等方面的质疑]

 ·  · 
模型与技术 新模型发布

AtheneV2 72B:Qwen微调版本,专注代码补全、数学和日志提取

[围绕AtheneV2 72B展开讨论,包括基准测试、性能表现、与其他模型比较、特定概念、使用权限和内存需求等方面,整体讨论热度不高]

 ·  · 
模型与技术 新模型发布

GLM - Edge系列:1.5B - 5B,聊天与视觉

[关于GLM - Edge系列(1.5b - 5B,包含聊天和视觉功能)的讨论,有对其表示支持并下载的,也有指出问题的,还有将其与其他模型比较、关注技术相关方面的情况,整体氛围较平和。]

 ·  · 
模型与技术 新模型发布

Aion-RP-Llama-3.1-8B:全新角色扮演大师

[原帖介绍Aion - RP - Llama - 3.1 - 8B模型,评论围绕模型的提示格式、资源(如gguf)、对无审查的疑惑、对免费模型注册的怀疑以及对推广的反感等展开讨论,氛围比较多元且分散]

 ·  · 
模型与技术 新模型发布

阿里QwQ 32B模型挑战多模型且开源

[围绕阿里巴巴QwQ 32B模型展开多方面讨论,包括与其他模型对比、性能表现、在不同任务中的体验、开源情况等,同时涉及地缘政治和经济相关话题,讨论氛围热烈且观点多样]

 ·  · 
模型与技术 新模型发布

Qwen团队实验推理模型QwQ-32B - Preview在HuggingChat免费上线

[关于QwQ - 32B - Preview模型在HuggingChat免费使用引发讨论,包括模型表现、测试结果、硬件需求、UI设计等多方面,整体氛围积极且充满探索性]

 ·  · 
模型与技术 新模型发布

Deepseek新多模态模型Janus可在浏览器本地运行

[围绕新发布的Janus模型等,讨论了模型命名、本地运行、隐私保护等方面,同时有由模型名称引发的联想、幽默反应,还有涉及争议性的AI助手内容]

 ·  · 
模型与技术 新模型发布

Qwen发布QwQ预览版:提升AI推理能力的开放模型

[Qwen发布QwQ预览版,有评论展示其问答交互能力,有对其表示惊叹和认可的,也有对模型开放度好奇的,还有一个量子力学相关的龟兔问题的讨论]

 ·  ·