模型与技术 新模型发布

为何难以找到适配消费级GPU的大语言模型规模

[原帖探讨在消费级GPU上难以找到合适LLM规模的问题,评论中有认为现有模型已足够的,有指出其他影响因素如硬件、企业目的的,还有对不同规模模型实用性的讨论,整体氛围理性探讨且存在多种观点碰撞]

 ·  · 
模型与技术 新模型发布

FishSpeech v1.5:多语言零样本即时语音克隆,仅5亿参数且低延迟排名TTS - Arena第二

[围绕FishSpeech v1.5展开讨论,涉及商业性、功能、排名等方面,氛围比较平和,有肯定也有质疑]

 ·  · 
模型与技术 新模型发布

Virtuoso - Small:Arcee.ai新推出的14B大语言模型超越SuperNova - Medius

[关于新模型Virtuoso - Small超越SuperNova - Medius的帖子引发讨论,主要观点围绕模型对比、评估分数、试用体验和相关技术问题等方面,整体氛围较平和理性]

 ·  · 
模型与技术 新模型发布

修改llama.cpp以支持Llama-3_1-Nemotron-51B

[原帖作者修改llama.cpp以支持特定模型,评论者围绕模型性能、量化、代码相关问题展开讨论,整体氛围积极且充满技术交流]

 ·  · 
模型与技术 新模型发布

Llama - 3.1 - 8B作为评估器的早期训练结果

[围绕Llama - 3.1 - 8B作为评估器的早期结果展开讨论,涉及模型改进、评估相关概念、训练目标及结果、信任度等多方面话题,整体氛围较平和]

 ·  · 
模型与技术 新模型发布

亚马逊推出其大型语言模型家族Nova

[围绕亚马逊推出的LLM家族Nova,讨论了其在价格、竞争力、闭源性质、与AWS关系等多方面的情况,观点有正面有负面,整体氛围比较复杂]

 ·  · 
模型与技术 新模型发布

耐力100B v1鼓手模型:精简版米斯特拉尔大型2407 123B且经RP微调

[关于Drummer"s Endurance 100B v1模型的讨论,涉及模型量化、目标用户、存储空间、硬件配置等多方面内容,整体氛围比较专业、理性]

 ·  · 
模型与技术 新模型发布

Nous DisTrO更新,宣布新15b模型及DeMo论文

[关于Nous DisTrO的更新、DeMo论文和新15b模型,有人分享资源,有人阐述相关概念,多数人表达正面情感,也有人提出疑问和好奇之处]

 ·  · 
模型与技术 新模型发布

尝试制作可在云端免费使用的无审查版Llama 405b模型

[关于制作可在云端免费使用的无审查版Llama 405b模型的帖子引发多种讨论,包括对模型本身的疑问、肯定、质疑,以及对免费使用背后情况的关注等,氛围比较多元]

 ·  · 
模型与技术 新模型发布

Drummer"s Behemoth 123B v1.2 - 最终版

[TheLocalDrummer分享Drummer"s Behemoth 123B v1.2 - The Definitive Edition相关链接并表示为最终优化版本,评论者们对模型基础、性能、相关工作、小型模型等方面进行了提问、解答和讨论,整体氛围积极且探索性强]

 ·  ·