模型与技术 新模型发布

NaturalLM -7B Instruct:自然发声的大语言模型

[围绕NaturalLM 7B Instruct展开讨论,包括对其模型表现的质疑、训练情况的探讨,还有对人类克隆相关问题的观点以及积极与消极态度并存的情况]

 ·  · 
模型与技术 新模型发布

各公司将推出的下一个模型会是什么

[原帖讨论2024年底前各大公司人工智能模型发布情况,评论主要表达对不同模型发布的期待、希望,也有对某些模型的否定评价,整体氛围比较积极且充满期待]

 ·  · 
模型与技术 新模型发布

谷歌欲推出符合社区期待的优秀模型

原贴链接 嗨!我现在是谷歌的首席执行官,我们想要推出一些很棒的模型,这些模型不仅质量高,而且还能满足社区想要的预期和能力。我们在倾听大家的声音,并且已经看到了大家对诸如更长的语境、多语言性等方面的兴趣。但鉴于你们都很厉害,我们觉得直接询问并看看大家有什么想法会更好。请随时提出你们对新模型的任何要求。 详细内容: 《Google寻求社区意见,改进Gemma模型引热议》 近日,Google的一位首席官员在Reddit上发布了一个帖子,引发了众多网友的热烈讨论。帖子中表示Google希望推出一些不仅质量出色,还能满足社区期望和能力需求的模型,并征求大家对于新模型的想法。这一帖子获得了极高的关注度,众多网友纷纷留言分享自己的见解。 讨论的焦点主要集中在以下几个方面: 有人认为应该提供多种模型大小,以满足不同用户的硬件和需求,例如从0.5B到72B参数的范围。还有人希望模型在特定领域表现出色,如科学研究、创意写作或代码生成,并且具有更好的写作质量、长上下文支持、多语言支持等功能。 有用户提到,希望模型能够在24GB的VRAM限制下,达到最佳性能和容量平衡。同时,也有人期待模型能够减少不必要的拒绝和审查,提高本地推理能力,以及在多角色聊天、工具调用、语音生成等方面有所突破。 例如,有用户分享道:“作为一名在相关领域工作的人员,我深知模型在实际应用中的局限性。比如在处理长文本时,很多模型在8K之后就开始质量下降,因此希望新模型能在长上下文方面有更好的表现。” 然而,也存在一些不同的声音。有人认为不需要过多关注多模态,而应专注于文本任务的优化。 在众多观点中,特别有见地的观点包括:提出模型应根据硬件能力优化大小,强调长上下文的质量而非单纯追求数量,以及针对不同任务定制专业化模型等。这些观点丰富了讨论,为模型的改进提供了多元的思路。 总体而言,这次讨论充分展示了社区对于Gemma模型的期待和建议,为Google改进模型提供了丰富的参考。未来,我们期待看到更加出色和符合用户需求的Gemma模型。

 ·  · 
模型与技术 新模型发布

Hermes 3 3B发布,使用体验很棒!

[原帖分享在iPhone上使用Hermes 3 3B的良好体验,评论围绕Hermes 3 LLM与原版对比、性能表现、多语言任务能力、在特定环境(如Xcode、iPhone)下的使用等展开讨论,氛围比较理性客观]

 ·  · 
模型与技术 新模型发布

Phi 3.5 mini instruct:被忽视的实用模型

[关于Phi 3.5 mini模型为何不被更多讨论,评论者从模型自身不足、竞争、审查、适配场景等多方面给出观点,整体氛围偏向否定但也有肯定其特定优势之处。]

 ·  · 
模型与技术 新模型发布

谷歌发布Gemini 2.0 Flash,支持原生音频与图像生成

[Google发布Gemini 2.0 Flash后,大家在讨论其功能、与其他模型对比、版本差异、使用相关问题等,整体氛围积极且充满期待]

 ·  · 
模型与技术 新模型发布

Recursal发布两款新线性模型:QRWKV6 - 32B与Finch - MoE - 37B - A11B

[新模型QRWKV6 - 32B和Finch - MoE - 37B - A11B发布,大家围绕模型的各个方面展开讨论,包括对模型的认可期待、运行相关、性能比较等,整体氛围积极且充满探索欲]

 ·  · 
模型与技术 新模型发布

DeepSeek V2.5 - 1210:DeepSeek V2.5最终版本

围绕DeepSeek - V2.5 - 1210作为DeepSeek V2.5系列的最终版本,大家讨论了它的功能、性能、运行要求、与其他模型的比较等多方面内容,氛围较为客观且积极探索。

 ·  · 
模型与技术 新模型发布

DeepSeek - AI发布DeepSeek - V2.5 - 1210

[围绕DeepSeek - V2.5 - 1210展开讨论,大家表达满意、期待新功能、版本更新等积极态度]

 ·  · 
模型与技术 新模型发布

InternVL2.5发布(1B至78B),能否取代GPT - 4o?

[关于InternVL2.5发布的讨论涵盖其性能、与GPT - 4o的比较、在不同语言中的表现等多方面,同时也涉及中美技术竞争、成果发布时间等话题,讨论热度不一,存在争议也有积极的支持。]

 ·  ·