原贴链接

所以我刚开始尝试在本地运行自己的LLM，但我是一个经验丰富的开发者，并且我想设置一个露营开发环境。所以我买了一些Viture Pro眼镜和一个Minisforum S100（Intel N100 + 8GB内存 - https://store.minisforum.com/products/minisforum-s100）。足够运行VSCode、Node等。我没想到我需要太多。特别是考虑到它的低功耗，似乎非常理想。然而，现在我读得越多，看关于用AI编码的内容越多，我就越想尝试，但用这个设备是不是毫无意义，因为它根本无法运行，或者它会非常慢？比如，我可以要求AI设置一个Todo应用，去喝杯啤酒，回来时它就完成了，而不是仅仅使用互联网连接并支付Cursor的费用，这样速度更快？我对硬件相当陌生，但我知道AI需要电力和内存。我不知道（而且我敢肯定这对你们所有人来说是一个基本且显而易见的问题，所以我道歉，但我无法在视频中找到答案）这是否只是为了让它快速生成答案，还是它根本无法运行？如果我要使用AI进行编码，我是否只需要购买一台带有我能负担得起的最好RTX显卡的MSI游戏笔记本电脑或一台新的MBP max之类的东西？我不介意慢，因为我可以在AI生成答案时做其他事情。感谢大家的帮助！

编辑：哇，大家！这么多有用的信息。我不知道我不知道什么，你们给了我很多值得进一步研究的东西。非常喜欢这一切！

讨论总结

本次讨论主要围绕在低配置机器上运行本地大型语言模型（LLM）的可行性和性能优化展开。讨论中涉及了硬件配置、内存带宽、显卡选择等关键因素。多数评论者认为，尽管低配置机器可以运行LLM，但速度会非常慢，且可能需要升级内存和显卡以提高性能。高性能显卡如RTX系列被推荐用于加速运行，而MacBook Pro等便携设备也被认为是一个实用的选择。讨论还涉及了使用云服务和远程服务器的解决方案，以及AI在编程中的实际应用和局限性。总体而言，讨论内容丰富，涵盖了从硬件选择到实际应用的多个方面。

主要观点

👍 Intel N100处理器和8GB内存的配置可以运行LLM，但速度会因单通道RAM而减半。
- 支持理由：评论者PermanentLiminality确认了这一配置的可行性，但强调了内存带宽的重要性。
- 反对声音：无明显反对声音，但多数评论者建议升级内存以提高性能。
🔥 内存带宽是影响AI运行速度的关键因素。
- 正方观点：评论者therealreallad强调了内存带宽在LLM运行中的重要性，指出高性能显卡如RTX 4090具有显著优势。
- 反方观点：无明显反方观点，多数评论者认同内存带宽的重要性。
💡 为了更好地运行AI，特别是用于编码的AI，需要一台能够容纳全尺寸显卡的塔式机箱。
- 支持理由：评论者PermanentLiminality建议使用全尺寸塔式机箱以容纳高性能显卡，如10GB VRAM的P102或12GB VRAM的RTX 3060。
- 反对声音：无明显反对声音，多数评论者认同这一建议。
🚀 最新的RTX显卡可以显著提高LLM的运行速度，前提是VRAM足够。
- 支持理由：评论者panthereal认为最新的RTX显卡可以显著提高运行速度，前提是VRAM足够。
- 反对声音：无明显反对声音，多数评论者认同高性能显卡的重要性。
🌐 使用云服务或订阅大型LLM提供商，以获得更好的性能。
- 支持理由：评论者jonathanx37建议使用云服务或订阅大型LLM提供商，以获得更好的性能。
- 反对声音：无明显反对声音，多数评论者认同云服务的实用性。

金句与有趣评论

“😂 Yes it should run. It has AVX2. The N100 is single channel RAM so that cuts the speed in half compared to an i3 of a similar generation. It’s all about memory bandwidth.”
- 亮点：评论者PermanentLiminality详细解释了硬件配置对LLM运行速度的影响，强调了内存带宽的重要性。
“🤔 Faster” is perhaps an understatement. A way to look at it is… at least 60,000 people have walked from Atlanta to Savannah over a 5’ish-week period and got there fine. But if you’re going to make that trip, you’re probably gonna want to drive or fly instead…”
- 亮点：评论者dllm0604通过生动的比喻说明了高性能显卡在提升LLM运行速度中的重要性。
“👀 As long as you have enough VRAM to run the model the latest RTX should run it fastest.”
- 亮点：评论者panthereal强调了VRAM在LLM运行中的关键作用，并推荐使用最新的RTX显卡。

情感分析

讨论的总体情感倾向较为积极，多数评论者提供了详细的硬件配置建议和性能优化方案。主要分歧点在于是否需要升级硬件以提高LLM的运行速度，部分评论者建议使用云服务或订阅大型LLM提供商以获得更好的性能。可能的原因是，部分用户希望在现有硬件上运行LLM，而另一部分用户则更倾向于投资高性能硬件以获得更好的体验。

趋势与预测

新兴话题：随着AI技术的普及，如何在低配置机器上高效运行LLM将成为一个持续讨论的话题。
潜在影响：硬件厂商可能会推出更多针对AI优化的产品，以满足用户对高性能硬件的需求。同时，云服务提供商也将继续扩展其AI服务，以吸引更多用户。

详细内容：

标题：关于在本地运行 LLM 的热门讨论

在 Reddit 上，一则名为“Can a local LLM run on basically any machine, but the latest RTX whatever video card makes it run faster?”的帖子引发了热烈讨论。该帖获得了众多关注，评论众多。帖子中，发帖者表示自己是开发新手，新购置了一些设备，包括 Viture Pro 眼镜和 Minisforum S100（Intel N100 + 8GB 内存），想尝试在本地运行自己的 LLM，询问这样的配置能否运行，还是会非常慢，若要用于 AI 编码是否需要购买配置更高的设备，如配备顶级 RTX 的 MSI 游戏笔记本或新款 MBP max 等。

讨论焦点与观点分析：有人指出，此配置应该可以运行，但其 N100 是单通道内存，速度会减半。对于 AI 来说，最好有一个能安装全尺寸显卡的大型机箱，如 10GB VRAM 的 P102 显卡只需 40 美元，12GB VRAM 的 RTX 3060 则约 200 美元，更大的模型编码效果更好。有人认为，该配置运行起来时间会非常长，功耗也相当显著，目前还没有高效节能的 AI 解决方案，或许选择 Mac Mini 是个不错的选择。也有人表示，不要让人打击积极性，小模型运行没问题，但要升级内存，8GB 对于现在的桌面用途来说是不够的。还有人提出，存在运行 LLM 所需的最低内存量，非常小的模型可以在边缘设备上运行，但大型模型需要 GPU 和大量 VRAM，甚至需要多个 GPU 和大量 VRAM。

讨论中，有人认为 MBP 是最实用的选择，也有人建议使用微软的 copilot 或为更大的模型付费。同时，有人提到在没有足够 VRAM 的情况下，可选择其他一些解决方案。

讨论总结#

主要观点#

金句与有趣评论#

情感分析#

趋势与预测#

详细内容：#