大家好，

我想了解一下你们在使用LLM时使用的配置，特别是在个人PC/笔记本配置和服务器配置方面，用于训练和测试模型。我最近加入了一家初创公司，我们目前有两块工业级NVIDIA GPU，但我觉得这可能不足以应对我们计划的工作。

我特别感兴趣的是：

你的个人配置： 你使用什么笔记本或台式机进行编码、测试和一般的LLM工作？你有没有发现某些特定的硬件配置（CPU、RAM、GPU）效果最好？
服务器配置： 你使用什么硬件进行模型训练？你是使用云解决方案、本地服务器，还是两者的结合？你认为哪些GPU或配置最适合处理大型模型？
具体模型： 你主要使用哪些LLM，你的配置如何处理这些模型？

我一直在阅读关于苹果的解决方案，比如M2 Ultra和MacBook Pro，因为它们的统一内存架构，但我还不确定它们是否适合公司的工作。但目前，我只有一个4700的PC配置，无法运行更高级的模型。

任何关于哪些配置对你最有效的见解或建议都将非常感谢。我正在寻找灵感，以改进我的测试配置以及我们将在生产中使用的配置。谢谢！

讨论总结

本次讨论主要围绕LLM工程师的工作和家庭硬件配置、使用的模型以及成本效益展开。参与者分享了各自的工作和家庭设置，包括使用的高性能硬件、云解决方案、自定义中间件等。讨论中涉及的模型包括Llama、CodeQwen、Gemma2等，并探讨了这些模型在不同硬件配置下的表现。此外，成本效益和二手市场购买硬件的策略也得到了广泛关注。总体而言，讨论内容丰富，涵盖了从个人开发到服务器训练的多种场景，为LLM工程师提供了宝贵的参考和建议。

主要观点

👍 使用高性能硬件
- 支持理由：高性能硬件如ThreadRipper、A6000、NVIDIA 4090等能够有效处理大型语言模型，提升工作效率。
- 反对声音：高性能硬件成本较高，可能不适合所有用户。
🔥 云解决方案的性价比
- 正方观点：云GPU如Amazon实例在需求波动大时成本效益高，长期使用成本低于本地GPU。
- 反方观点：云解决方案可能受网络和延迟影响，不适合所有应用场景。
💡 自定义中间件的应用
- 解释：通过自定义中间件如Wilmer，可以实现多模型协作，提升工作效率和灵活性。
👍 二手市场购买硬件
- 支持理由：二手市场购买硬件可以节省成本，特别是在北美市场，二手服务器零件价格低于消费级硬件。
- 反对声音：二手硬件可能存在性能和稳定性问题。
🔥 大内存的优势
- 正方观点：大内存如128G RAM对处理大型模型非常有帮助，尤其是在处理最新模型的巨大上下文和KV缓存时。
- 反方观点：大内存硬件成本较高，可能不适合所有用户。

金句与有趣评论

“😂 My secret is I buy literally everything on the second hand market, got saved searches on eBay and Kijiji to be able to snap up deals quick.”
- 亮点：强调了二手市场购买硬件的策略，节省成本。
“🤔 I have the M2 ultra, and it’s fantastic for my personal development but I wouldn’t subject my teammates at work to it. Can be a bit slow.”
- 亮点：分享了个人开发与团队工作对硬件性能的不同需求。
“👀 It depends, if more VRAM then buy new GPU, if only performance increase around 30% then not worth it, use cloud GPU instead.”
- 亮点：讨论了硬件升级的性价比，强调了云GPU的经济性。
“😂 3090 300w, 64gb ddr5 6000, and gigabit ethernet. It runs 70b at a workable quant.”
- 亮点：分享了高性能硬件配置在量化后的表现，展示了硬件与模型的匹配度。
“🤔 With recent models such as mistral nemo with huge contexts and thus huge kv caches, the large memory is such a boon.”
- 亮点：强调了大内存在处理最新模型时的优势，提升了讨论的技术深度。

情感分析

讨论的总体情感倾向较为积极，参与者普遍分享了各自的经验和建议，提供了丰富的硬件配置和模型使用信息。主要分歧点在于硬件成本与性能的平衡，以及云解决方案与本地硬件的选择。可能的原因包括个人预算、工作需求和硬件市场的变化。

趋势与预测

新兴话题：随着LLM模型的不断发展，大内存和高性能硬件的需求将持续增加。
潜在影响：硬件配置的优化和成本效益的提升将直接影响LLM工程师的工作效率和项目进展，可能引发更多关于硬件选择和云解决方案的讨论。

详细内容：

《LLM 工程师的电脑与服务器配置大揭秘》

在 Reddit 上，有一个热度颇高的帖子，题为“作为一名 LLM 工程师，您使用何种笔记本电脑/PC 和服务器配置，以及您最常使用哪些模型？” 该帖子获得了众多关注，评论数众多。

帖子的发起者表示自己刚加入一家初创公司，目前有两块工业 NVIDIA GPU，但觉得可能无法满足计划中的工作。并特别关注个人电脑配置、服务器配置以及常用的 LLM 模型等方面，希望能得到大家的建议和经验分享。

讨论焦点主要集中在以下几个方面：有人分享工作中使用 ThreadRipper 搭配 A6000，虽然有 48GB VRAM，但散热是个问题。在家则使用 V4 Xeons 和 3090、3060、P40、P100 等。还提到模型方面，如 Llama 3.1 70B 等。有人拥有 M2 ultra，认为其对个人开发很棒，但不适合工作团队，还分享了多种模型在不同任务中的应用。有人表示等待 Nvidia 新阵容，认为当前训练/调试用云 GPU 更划算。还有人使用 3090 搭配特定配置，运行效果良好。有人在工作中使用亚马逊实例，在家使用 4090 等。有人使用 Proxmox 服务器并分享了详细硬件配置。

例如，有人说：“我工作中使用 ThreadRipper 搭配 A6000。它们很安静并且有 48GB VRAM，但是我不会说它们容易散热，在默认风扇曲线下会超过 80°C ，这让我很紧张，所以我用软件手动调整风扇曲线来保持在 70°C 。”

在模型方面，有人认为 Gemma2 27B 在 JSON 提取方面表现出色，9B 版本的准确率能达到 95-96%，资源利用率更优。

对于是否等待 Nvidia 新阵容，大家观点不一。有人认为如果新 GPU 增加更多 VRAM 则值得购买，否则使用云 GPU 更经济。

总体来说，大家在硬件配置和模型选择上各有经验和见解，为 LLM 工程师们提供了丰富的参考。但究竟哪种配置和模型最适合，还需根据具体需求和预算来决定。

讨论总结#

主要观点#

金句与有趣评论#

情感分析#

趋势与预测#

详细内容：#