模型与技术 训练与微调技术

Llama 3.2 3B 无审查微调模型探讨

原贴链接 我们有什么?我在寻找: 无审查(不是NSFW,我正在制作有用的东西) 如果是GGUF,如果不是已经在Ollama上 Llama 3.2 3B 我希望Teknium能用Hermes开放它,但我并不抱太大希望。有人有好用的吗? 详细内容: 标题:关于 Llama 3.2 3B 无审查精细调整的热门讨论 在 Reddit 上,一篇题为“Llama 3.2 3B Uncensored Fine-Tunes?”的帖子引起了广泛关注。该帖子的作者正在寻找无审查、GGUF 格式且为 Llama 3.2 3B 的内容,并期待 Teknium 能与 Hermes 一起开放相关内容,但对此不抱太大希望。此帖获得了众多的回复和讨论。 讨论的焦点主要集中在以下几个方面: 有人分享了相关的链接,如 https://huggingface.co/mylesgoose/Llama-3.2-3B-instruct-abliterated-Q8_0-GGUF ,并对一些术语进行了探讨,比如“abliterated”的含义。有人提供了相关的解释/指南链接:https://huggingface.co/blog/mlabonne/abliteration 。 有用户表示自己是一名作家,将 LLMs 当作身旁的活人来交流,通过它来完善自己的写作,比如询问“这样读起来是否太不连贯?”等问题,并打算对模型进行精细调整,以提高工作效率和增加收入。但同时也对精细调整后的模型效果存在疑虑,比如担心 13B 模型的“智能”是否能达到预期,能否像自己一样写作并节省时间,还是需要专注于 70B+的模型。 有人分享自己尝试 3.2 abliterated 的个人经历,称其和原始版本似乎没什么不同,而另有人则表示无审查的版本确实没有审查限制。 有用户提到自己拥有 136GB 的 VRAM,几个月前刚搭建了第一个 AI 设备,想先从简单的精细调整开始学习。还有用户表示自己是个只有 22GB 内存的农民,不知道自己的设备是否能进行训练。有人指出内存无法用于训练,只有 VRAM 可以,甚至可以租用便宜的服务器进行训练。 讨论中也有一些有趣或引发思考的观点,比如有人因为说要使用其他模型而不是自己训练而被点了反对。 总之,这场关于 Llama 3.2 3B 无审查精细调整的讨论涵盖了丰富的经验分享、技术探讨和观点碰撞。

 ·  · 
模型与技术 训练与微调技术

我制作了一个可配置的反滑移采样器,可以在单词和短语级别下调概率。

讨论围绕一个可配置的反冗余采样器展开,探讨了其在单词和短语级别下调概率的应用、潜在改进和与其他技术的比较。

 ·  · 
模型与技术 训练与微调技术

波兰LLM 1.5B在单个GPU上持续预训练,这是一年工作的成果。

讨论围绕波兰语1.5B模型的持续预训练项目展开,涉及数据集、技术建议、赞赏和幽默等多个方面,总体氛围积极且技术性强。

 ·  · 
模型与技术 训练与微调技术

Qwen2.5能够被越狱,但并不完美。

讨论围绕如何通过特定系统提示“越狱”Qwen2.5模型,使其在敏感问题上提供未经审查的回答,但涉及中国政府的直接问题仍受审查,引发对模型偏见和审查机制的深入探讨。

 ·  · 
模型与技术 训练与微调技术

如何在自己的数据上微调大型语言模型(LLM)?

讨论围绕如何在个人数据上微调大型语言模型(LLM),特别是针对Shadcn UI组件库,涉及硬件需求、数据集准备、微调方法和云服务选择。

 ·  · 
模型与技术 训练与微调技术

[谷歌DeepMind] 通过强化学习训练语言模型进行自我修正

讨论围绕 Google DeepMind 的自我纠正语言模型训练方法展开,涉及技术细节、公司策略、研究价值及实际应用。

 ·  · 
模型与技术 训练与微调技术

有人在工作中对大型语言模型进行微调吗?你们的用例是什么?

讨论围绕工作中微调大型语言模型的实际应用、工作流程、遇到的挑战和模型选择展开,涵盖了从数据处理到模型效率提升的多个方面。

 ·  · 
模型与技术 训练与微调技术

加快LLM训练的技巧指南

讨论围绕如何通过量化、硬件和算法优化加速LLM训练,减少VRAM使用,并强调高质量数据的重要性,社区对作者的贡献表示高度认可。

 ·  · 
模型与技术 训练与微调技术

开放草莓

讨论围绕“Open Strawberry”开源项目展开,探讨了其方法论、功能需求及与其他开源AI模型的类比,同时涉及强化学习在数据生成中的必要性。

 ·  · 
模型与技术 训练与微调技术

为什么使用验证器比微调大型语言模型更好?

讨论围绕大型语言模型(LLM)的微调和验证器方法展开,探讨了生成与区分、技术差异、泛化能力等关键话题,总体氛围偏向技术探讨和理性分析。

 ·  ·