原贴链接

以下是3个新的Llama 3.2模型（每个7B），它们已被增强并扩展到67层/606个张量。这些模型可用于任何创意用例。每个仓库中的每个模型都有示例生成、设置和输出。所有仓库也包含3个ARM量化。我为每个模型添加了一个“去审查”评级，10为最佳，1为最差。Llama 3.2在遵循指令方面似乎优于Llama 3和Llama 3.1。增强功能提高了细微差别、情感、散文深度以及指令遵循能力（与Darkest Planet 16.5B中使用的增强功能相同）。审查级别和模型偏差通过提示（PROMPT）级别控制。每个仓库中的一些示例展示了使用散文（PROSE）控制来控制散文输出，一些示例展示了提示本身包含的散文控制。模型：[https://huggingface.co/DavidAU/L3.2 - Rogue - Creative - Instruct - 7B - GGUF]（去审查：3）、[https://huggingface.co/DavidAU/L3.2 - Rogue - Creative - Instruct - Uncensored - Abliterated - 7B - GGUF]（去审查：9）、[https://huggingface.co/DavidAU/L3.3 - Rogue - Creative - Instruct - Uncensored - 7B - GGUF]（去审查：7）。去审查评级基于获得“无审查”答案所需的重新生成（如果有）的次数。

讨论总结

这是一个关于新的Llama 3.2模型的讨论。原帖介绍了新的Llama 3.2模型的相关情况，包括模型的结构、去审查评级等。评论者们的观点多样，有对模型效果持怀疑态度的，也有给予正面评价的，同时还有围绕模型的测试、评估、操作以及一些概念和特定方法进行提问和探讨的。

主要观点

👎 新的Llama 3.2模型在实际使用中效果不好
- 支持理由：试过很多类似拼凑的模型，看起来不错实际不好。
- 反对声音：新模型有价值，需要测试调整发掘。
👍 用过作者之前的模型，整体感觉不错
- 正方观点：之前用过感觉好，虽有时啰嗦。
- 反方观点：无。
💡 新模型的改进需要很多尝试和测试才能达到当前状态
- 解释：要通过不同测试和调整发掘价值，有自己的测试流程等。
👀 消融操作得当有提升且比强力微调侵入性小
- 解释：消融不是削弱，操作得当成有提升。
🤔 在reddit帖子标题加上huggingface名字有助于增加可信度和关注度
- 解释：能提升帖子的可信度，吸引更多关注。

金句与有趣评论

“😂 Errr. These Frankenstein models are almost always lobotomized. They look cool on paper but in actual use.. I’ve tried and tested a ton of them, they’re just not good.”
- 亮点：形象地将新模型比作拼凑的弗兰肯斯坦模型，表达对模型效果的怀疑。
“🤔 If you want max creativity from a model you have push it right to the edge ; half measures will not cut it.”
- 亮点：提出从模型获取最大创造力的方法。
“👀 I measure improvement from the baseline model. If it does not measure up or minimal it is not uploaded.”
- 亮点：阐述自己衡量模型改进的方式。
“👍 I’ve used a few of your models before. Super neat stuff.”
- 亮点：给出对作者之前模型的正面反馈。
“😎 I’m glad someone is still going forward with abliteration.”
- 亮点：表达对消融操作继续进行的支持。

情感分析

总体情感倾向较为中性。主要分歧点在于对Llama 3.2模型的效果评价，部分人怀疑其效果不佳，部分人觉得不错。可能的原因是大家使用模型的场景、测试方式以及对模型改进的理解不同。

趋势与预测

新兴话题：“brainstorm 40x”方法在小模型上的应用。
潜在影响：如果新的Llama 3.2模型被更多人认可，可能会对自然语言处理领域的相关应用产生积极影响，如在角色扮演等场景下提供更好的效果。

详细内容：

标题：Llama 3.2 模型的创新与争议在 Reddit 引发热议

近日，Reddit 上一篇关于三个增强版 Llama 3.2 模型（每个 7B）的帖子引起了广泛关注。该帖获得了众多点赞和大量评论。帖子主要介绍了这三个模型在创意用途方面的特点，包括增强的层次和张量数量，以及去审查评级等，并提供了相关模型的链接。

讨论的焦点集中在这些模型的实际效果和创新方法上。有人认为这些“拼凑”的模型实际效果不佳，比如“lemon07r”表示：“这些拼凑的模型在实际使用中表现不佳，不如直接微调常规模型。”但也有人持不同看法，像“Dangerous_Fix_5526”称：“经过多次尝试和改进，这些模型在特定范围内运行良好，能够在不破坏模型本身的前提下打破预测，实现最大的创造力。”

还有用户如“SirRece”指出：“消融并不是弱化，它更复杂，常常会带来提升。去除审查在不改变基础模型的情况下是去除审查的最佳方法之一。”同时，“export_tank_harmful”分享了自己使用相关模型的经历，并通过具体案例解释了消融的作用。

关于模型的测试方法，“Dangerous_Fix_5526”详细阐述了一系列测试流程，包括基础变化的 PPL 测试、核心变化的已知测试提示、温度和重复惩罚的效果检查、尝试破坏新模型以及收集用户反馈等。

总的来说，这次关于 Llama 3.2 模型的讨论展现了大家对于模型创新和实际应用效果的关注与思考，不同观点的碰撞也为进一步探索模型的发展提供了多样的思路。但究竟这些模型能否在实际应用中取得令人满意的效果，还需要更多的实践和验证。

讨论总结#

主要观点#

金句与有趣评论#

情感分析#

趋势与预测#

详细内容：#