原贴链接

TL;DR:我构建了Kiln,一个让微调大型语言模型(LLM)变得容易的新免费工具。在这个演示中,我仅用18分钟就创建了9个微调模型(包括Llama 3.x、Mixtral和GPT - 4o - mini),总花费不到6美元就取得了很好的结果。这完全是从零开始的,包括任务定义、合成数据集生成和模型部署。代码库都在[GitHub](https://github.com/Kiln - AI/Kiln)。演示:在下面的演示视频中,我在18分钟的工作内(不包括等待训练/数据生成的时间)创建了9个模型。[2分钟]:定义任务、目标和模式;[9分钟]:合成数据生成:使用主题树、大型模型、思维链和交互式用户界面创建920个高质量示例;[5分钟]:分配9个微调任务:Fireworks(Llama 3.2 1b/3b/11b,Llama 3.1 8b/70b,Mixtral 8x7b),OpenAI(GPT 4o - mini和4o),Unsloth(Llama 3.2 1b/3b);[2分钟]:部署模型并测试它们是否有效。结果:得到的小模型运行得相当好,而之前基础模型未能产生正确的风格和结构。总花费不到6美元(不包括GPT 4o的16美元,而且可能不需要它)。最小的模型(Llama 3.2 1B)比我们在合成数据生成期间使用的模型快约10倍且便宜150倍。指南:我写了一份[详细的微调指南](https://github.com/Kiln - AI/Kiln/blob/main/guides/Fine%20Tuning%20LLM%20Models%20Guide.md),涵盖了关于部署、使用Unsloth/Ollama完全本地运行、导出到GGUF、数据策略以及评估等后续步骤的更多细节。反馈请求:我希望得到关于这个工具、用户体验和想法的反馈!以及关于下一步添加什么内容的建议(RAG?更多模型?图像?评估工具?)。如果有任何问题,请随时私信我。尝试一下:你可以[在这里下载Kiln](https://github.com/Kiln - AI/Kiln/releases/latest);并且请[在GitHub上给它加星](https://github.com/Kiln - AI/Kiln)。Kiln是100%免费的,Python库是MIT开源的。18分钟内从零创建9个微调模型的演示(为简洁而编辑)

讨论总结

这是一个关于Kiln工具的讨论,主题围绕Kiln工具的使用、数据微调等方面展开。主要观点包括对工具的认可、试用的意愿、在使用过程中遇到的技术问题,以及一些建设性的意见,如对微调前后进行基准测试等。总体氛围积极正面,但讨论热度较低,大多是用户提出的一些具体问题或者简单的正面反馈。

主要观点

  1. 👍 对Kiln工具感兴趣并打算尝试。
    • 支持理由:多位用户如mrskeptical00、Dalong_pub表示会尝试该工具。
    • 反对声音:无。
  2. 🔥 希望能使用自己的数据进行微调。
    • 正方观点:mrskeptical00明确询问是否有此选项。
    • 反方观点:无。
  3. 💡 建议对微调前后进行基准测试。
    • 理由:可以更好地衡量工具的效果。
  4. 💡 认为评估工具是接下来要考虑的内容。
    • 理由:尤其是针对主观或生成性任务的评估更难。
  5. 💡 认可文档与视频配合得很好。
    • 理由:即使不太理解内容也能感受到其优势。

金句与有趣评论

  1. “😂 mrskeptical00:I’ll give this a shot. Skimmed through the docs, is there an option for using your own data to fine tune?”
    • 亮点:直接表达尝试的意愿并提出关键问题。
  2. “🤔 Express - Director - 474:Good job! Would be cool to benchmark before and after the fine - tuning somehow :)”
    • 亮点:认可作者工作的同时提出建设性意见。
  3. “👀 marketflex_za: Hey, as I mentioned yesterday. This looks great. Today it looks even more great. :-)”
    • 亮点:简洁表达对工具积极态度的提升。

情感分析

总体情感倾向是积极正面的。主要分歧点较少,大多数用户都对Kiln工具表示认可或者感兴趣。可能的原因是这个工具本身具有一定的创新性和实用性,而且是免费的,吸引了用户的关注,不过由于可能是比较小众或者专业的工具,所以讨论热度不高。

趋势与预测

  • 新兴话题:评估工具的开发与完善,尤其是针对主观或生成性任务的评估。
  • 潜在影响:如果该工具发展良好且评估工具完善,可能会在相关的人工智能模型微调领域产生积极影响,吸引更多人使用该工具进行模型微调。

详细内容:

标题:Tool Demo:18 分钟内从零创建 9 个微调模型

在 Reddit 上,一个关于新免费工具 Kiln 的帖子引发了热烈讨论。此工具能让微调 LLMs 变得轻松,在短短 18 分钟内创建了 9 个微调模型,包括 Llama 3.x、Mixtral 和 GPT-4o-mini 等,总成本不到 6 美元,还取得了出色的结果。帖子获得了众多关注,评论数众多。

主要讨论方向集中在工具的使用方法、用户体验以及功能完善等方面。

在讨论中,有人表示愿意尝试这个工具,并询问是否有使用自己数据进行微调的选项。还有人提到了在使用过程中遇到的诸如无法一次性删除所有导入数据、OpenAI 连接错误、Ollama 评级无法正常工作等问题,以及对添加“删除全部”按钮、支持指向非本地运行的 LLM 等功能的期待。

有人称赞道:“干得好!要是能以某种方式对微调前后进行基准测试就更酷了。”还有人表示:“嘿,就像我昨天提到的。这看起来很棒。今天看起来更棒了。”有人说:“我会试试这个。”也有人称:“非常感谢。虽然我不太懂,但我确信这非常有用,而且文档和视频都很棒。”

此次讨论的共识在于大家对这个新工具表现出了浓厚的兴趣,同时也期待它能不断完善和优化。特别有见地的观点是希望能对微调前后进行基准测试,这将有助于更直观地评估工具的效果。

总之,这个关于 Kiln 的讨论展现了大家对新工具的期待和探索,也为工具的进一步发展提供了有价值的方向。