[新手求助] 有没有办法提高Llama3.1在对话中的注意力？

原贴链接

我使用Open WebUI与Llama3.1进行交互
虽然很有趣，但与它聊了超过10条消息后，它开始忘记最初的输入。如果在开始时，我说我的名字是idleWizard，我从事动画工作，我们开始谈论动画软件，然后是如何推广动画服务，它很快就会忘记我的名字或我做什么。有没有办法延长它保留初始信息的能力？
谢谢！

讨论总结

本次讨论主要围绕如何提高Llama3.1模型在对话中的注意力持久性展开。原帖作者在使用Open WebUI与Llama3.1交互时发现，模型在超过一定消息数量后会忘记初始输入的信息。评论中提出了多种解决方案，包括增加上下文大小和将初始信息作为系统提示的一部分，以保持上下文的连贯性。讨论中涉及了具体的操作方法、可能的影响以及模型的技术细节。

主要观点

👍 增加上下文大小
- 支持理由：通过增加上下文大小（如从2048调整至4096或8192），可以提高模型对初始信息的记忆能力。
- 反对声音：调整上下文大小可能会影响模型生成第一个token的时间。
🔥 使用系统提示
- 正方观点：将初始信息作为系统提示的一部分，并在聊天过程中持续使用，有助于保持上下文的连贯性。
- 反方观点：无明显反对声音。
💡 模型更新
- Llama3.1模型支持高达128k的上下文大小，但相关更新正在逐步推出。

金句与有趣评论

“😂 Increase de context size, I think default is 2048. You can crank it to 4096 or 8192”
- 亮点：直接提供了具体的上下文大小调整建议，具有很强的操作性。
“🤔 Include it as part of system prompt to enforce it and you can also keep using it while chatting to keep it in context.”
- 亮点：提出了一个简单有效的策略，通过系统提示来保持上下文的连贯性。
“👀 3.1 can do 128k context, but the rope scaling for this is slowly rolling out for llama.cpp., they updated a few days ago, but everyone that integrates llama.cpp into their core needs to update.”
- 亮点：提供了关于模型更新的最新信息，显示了技术的动态发展。

情感分析

讨论的总体情感倾向较为积极，用户们提供了具体的解决方案和技术建议。主要分歧点在于调整上下文大小可能带来的性能影响，但大多数用户对此持开放态度，认为这是提高模型性能的有效途径。

趋势与预测

新兴话题：随着模型更新的逐步推出，关于如何优化模型性能的讨论可能会进一步深入。
潜在影响：这些技术优化可能会提升用户与AI模型的交互体验，特别是在需要长时间对话的场景中。

讨论总结#

主要观点#

金句与有趣评论#

情感分析#

趋势与预测#

讨论总结

主要观点

金句与有趣评论

情感分析

趋势与预测