训练与微调技术

Llama 3.2 3B 无审查微调模型探讨

原贴链接我们有什么？我在寻找：无审查（不是NSFW，我正在制作有用的东西）如果是GGUF，如果不是已经在Ollama上 Llama 3.2 3B 我希望Teknium能用Hermes开放它，但我并不抱太大希望。有人有好用的吗？详细内容：标题：关于 Llama 3.2 3B 无审查精细调整的热门讨论在 Reddit 上，一篇题为“Llama 3.2 3B Uncensored Fine-Tunes?”的帖子引起了广泛关注。该帖子的作者正在寻找无审查、GGUF 格式且为 Llama 3.2 3B 的内容，并期待 Teknium 能与 Hermes 一起开放相关内容，但对此不抱太大希望。此帖获得了众多的回复和讨论。讨论的焦点主要集中在以下几个方面：有人分享了相关的链接，如 https://huggingface.co/mylesgoose/Llama-3.2-3B-instruct-abliterated-Q8_0-GGUF ，并对一些术语进行了探讨，比如“abliterated”的含义。有人提供了相关的解释/指南链接：https://huggingface.co/blog/mlabonne/abliteration 。有用户表示自己是一名作家，将 LLMs 当作身旁的活人来交流，通过它来完善自己的写作，比如询问“这样读起来是否太不连贯？”等问题，并打算对模型进行精细调整，以提高工作效率和增加收入。但同时也对精细调整后的模型效果存在疑虑，比如担心 13B 模型的“智能”是否能达到预期，能否像自己一样写作并节省时间，还是需要专注于 70B+的模型。有人分享自己尝试 3.2 abliterated 的个人经历，称其和原始版本似乎没什么不同，而另有人则表示无审查的版本确实没有审查限制。有用户提到自己拥有 136GB 的 VRAM，几个月前刚搭建了第一个 AI 设备，想先从简单的精细调整开始学习。还有用户表示自己是个只有 22GB 内存的农民，不知道自己的设备是否能进行训练。有人指出内存无法用于训练，只有 VRAM 可以，甚至可以租用便宜的服务器进行训练。讨论中也有一些有趣或引发思考的观点，比如有人因为说要使用其他模型而不是自己训练而被点了反对。总之，这场关于 Llama 3.2 3B 无审查精细调整的讨论涵盖了丰富的经验分享、技术探讨和观点碰撞。