原贴链接

几天前,我问过关于CPU和核心数量对推理速度的影响。今天,我决定在两台不同的机器上进行一个快速测试,看看更新的CPU和更快的RAM如何影响推理速度。(跳到底部查看TLDR)

机器:

机器1(NAS服务器):
CPU: 英特尔第六代i5-6400(4核4线程,Geekbench单核1126分,多核3060分)
RAM: 32GB ddr4内存,2133 MHz
OS: Unraid 6.12.10
软件: Ollama 0.3.5 + Open WebUI 0.3.16(通过Docker)

机器2(笔记本电脑):
CPU: 英特尔第十一代i5-1135G7(4核8线程,Geekbench单核1597分,多核4507分)
RAM: 16GB ddr4内存,4267 MHz(约服务器内存速度的2倍)
OS: KDE Neon 6.0
软件: Ollama 0.3.8 + Open WebUI 0.3.16(通过Docker)

测试结果:

两台机器使用相同的llama 3.1 8b-instruct-q4_K_S模型,无系统提示。我使用相同的提示运行了5次测试并记录了输出t/s。结果如下:

服务器:4.21, 4.19, 4.18, 4.17, 4.24 → 平均:4.198 t/s
笔记本电脑:5.93, 5.8, 5.44*, 5.87, 5.88 → 平均:5.784 t/s

*第3次运行是在第2次运行后不久进行的,导致测试开始前CPU温度冷却时间较短

额外上下文:

• 笔记本电脑启用了超线程,导致笔记本电脑上有8个有效核心。
• 在整个测试过程中,笔记本电脑的CPU使用率在所有核心上大约为50-80%,偶尔在一些核心上飙升至90-100%。服务器CPU使用率为100%,所有4个核心在整个运行期间都处于满负荷状态。

洞察:

这个测试表明,更新的CPU和更快的RAM可以提高LLM的推理速度。考虑到笔记本电脑CPU的性能仅略优于服务器CPU,并且考虑到笔记本电脑CPU在整个测试过程中的较低使用率,可以合理推断内存速度对推理速度的影响远大于CPU核心数量,这与之前的发现一致。然而,我应该承认这些测试是不确定的,并且存在局限性,为了得出这个结论,一些未经先前验证的假设被采纳。需要更全面的测试来完全理解CPU、内存和推理速度之间的关系。

讨论总结

本次讨论主要围绕CPU和内存对推理速度的影响展开,涉及多个技术细节和测试方法。参与者提出了关于内存通道配置、性能测试的建议,并对实际测试结果的有效性进行了质疑和讨论。总体上,讨论集中在如何更准确地评估内存和CPU对推理速度的具体影响,以及可能存在的其他限制因素。

主要观点

  1. 👍 内存通道配置的影响
    • 支持理由:NickNau 和 Chromix_ 都指出笔记本电脑可能在单通道模式下运行内存,这可能限制了性能的提升。
    • 反对声音:无明确反对,但有建议进行更详细的测试以验证。
  2. 🔥 内存速度与推理速度的关系
    • 正方观点:Chromix_ 和 marclbr 提出内存速度的提升并不直接等同于推理速度的翻倍提升,可能存在其他限制因素。
    • 反方观点:无明确反方,但有建议进行更详细的测试以验证。
  3. 💡 测试方法的改进
    • 解释:marclbr 建议在同一台电脑上进行两次测试,分别使用最大内存速度和减半的内存速度,以更公平地测试内存速度对性能的影响。

金句与有趣评论

  1. “😂 NickNau:I am wondering if your laptop actually runs RAM in single channel.”
    • 亮点:提出了一个关键的技术问题,即内存通道配置可能影响性能。
  2. “🤔 Chromix_:Your test unfortunately only shows that the slightly larger cache and CPU speed gets you a slightly faster inference speed.”
    • 亮点:指出了测试结果的局限性,并提出了可能的其他影响因素。
  3. “👀 marclbr:Another test that is worth doing to see how the memory speed affects the performance is running two tests on the same PC…”
    • 亮点:提出了一个创新的测试方法,以更准确地评估内存速度的影响。

情感分析

讨论的总体情感倾向较为中性,参与者主要关注技术细节和测试方法的准确性。主要分歧点在于内存速度和通道配置对推理速度的具体影响,以及如何进行更公平和准确的测试。

趋势与预测

  • 新兴话题:更详细的内存和CPU性能测试方法。
  • 潜在影响:对未来类似测试的准确性和可靠性有积极影响。

详细内容:

标题:关于 CPU 和内存对仅 CPU 系统推理速度影响的热门讨论

近日,有网友在 Reddit 上分享了一个关于 CPU 和内存对仅 CPU 系统推理速度影响的测试。此帖引起了众多关注,收获了大量的点赞和评论。

原帖中,作者在 2 台不同的机器上进行了测试,以探究较新的 CPU 和更快的 RAM 如何影响推理速度。机器 1 是一台 nas 服务器,配置为 Intel 6th gen i5-6400 的 CPU、32GB 2133 MHz 的 DDR4 内存等;机器 2 是一台笔记本电脑,配置为 Intel 11th gen i5-1135G7 的 CPU、16GB 4267 MHz 的 DDR4 内存等。测试结果显示,服务器的平均推理速度为 4.198 t/s,笔记本电脑为 5.784 t/s。

讨论的焦点主要集中在内存速度、CPU 核心数与推理速度之间的关系。有人提出,作者的笔记本电脑可能实际上是单通道运行内存,这可能解释了为何没有看到两倍的性能提升,并且表示自己有类似的 Thinkpad 电脑,增加 16GB 模块后性能大幅增加,明天可以运行相同模型并分享结果。

还有用户指出,测试中两台系统的 RAM 速度实际上是相同的,因为所谓的 4267 MHz 只是标注方式,实际并非如此。而且认为存在一些其他限制因素,比如笔记本电脑的内存可能是单通道运行,或者有后台程序大量占用内存,还可能与线程设置有关。

也有人提到,需要了解内存模块的安装数量以及是否使用双通道,并对笔记本电脑内存规格表示困惑。

此外,有用户建议在同一台电脑上进行不同内存速度的测试,先以最高内存速度运行测试,然后重启进入 BIOS 将内存频率设置为一半再重复测试。作者表示未来有时间会进行这样更公平的测试。

此次讨论表明,关于 CPU、内存与推理速度之间的关系还存在诸多争议和待解之谜,需要更全面和深入的测试来进一步明确。