原贴链接

不过针对大型语言模型（LLM）的实际基准测试很少。我发现：[https://www.youtube.com/watch?v=s6wt83TU_B4]在运行带有deepseekv2.5的LMStudio；[https://www.youtube.com/watch?v=J4qwuCXyAcU]在测试每秒18万亿次（t/s）运算的Q4 MLX的R1，我觉得另一张图应该是每秒16万亿次（t/s）运算的ollama的Q4_K_M。我认为这些是标记生成而非提示处理，并且是在低语境规模下。

讨论总结

这个讨论围绕Mac Studio M3 Ultra的LLM评测展开，涉及设备性能的多方面内容，如性能提升带来的变化、不同设备间的性能比较、提示处理速度、基准测试等，大家从不同角度分享观点，氛围理性且充满技术探讨氛围。

主要观点

👍 18t/s的速度在代码生成方面是可用的
- 支持理由：假设PP不是很糟糕的情况下可用于代码生成
- 反对声音：无
🔥 关于Mac Studio M3 Ultra的LLM评测缺乏实际基准测试，尤其是提示速度方面
- 正方观点：目前的评测数据存在如测试样本不足等问题，未涉及提示速度等
- 反方观点：无
💡 性能差异小得出乎意料
- 解释：考虑到Q4_K_M应该具有更高质量，但实际性能差异小
💡 MoE的整体结果令人印象深刻
- 解释：虽不是密集模型之王，但在其方面表现出色
💡 设备对于处理敏感数据的人员有用
- 解释：可以处理超敏感或受监管的数据

金句与有趣评论

“😂 ForsookComparison：18t/s is extremely usable for codegen assuming that PP isn’t horrible.”
- 亮点：提出在一定假设下18t/s速度对代码生成可用
“🤔 xrvz：Much like the Switch setting the bottom limit for gaming performance, Apple computers set the upper limit for the cost of the performance level they achieve.”
- 亮点：通过类比阐述苹果电脑性能与成本的关系
“👀 I would say those are token generation and not prompt processing. And at low context size.”
- 亮点：指出当前数据是令牌生成而非提示处理且上下文规模小
“😉 Surprisingly small difference in performance considering Q4_K_M should be higher quality..”
- 亮点：对性能差异小表示惊讶
“🤨 Overall impressive results for MoE, may not be the king of dense models but dam if it can’t blow through MoE..”
- 亮点：肯定MoE整体结果

情感分析

总体情感倾向较为中性，主要分歧点在于对一些性能数据的看法（如14.8 t/s的提示处理速度是否勉强可用）以及数据来源（如Qwen2.5 - 72b在Macbook pro上的速度数据）等，可能的原因是大家从不同的使用场景和期望出发进行考量。

趋势与预测

新兴话题：对设备并发处理能力的关注可能会引发后续讨论。
潜在影响：如果对设备性能等方面有更深入准确的评测，可能会影响消费者对Mac Studio M3 Ultra以及相关设备在处理LLM等任务时的选择。

详细内容：

标题：Mac Studio M3 Ultra 评测引发激烈讨论

近日，Reddit 上关于 Mac Studio M3 Ultra 的评测成为热门话题，吸引了众多网友的关注。原帖中提到了一些相关的基准测试链接，但针对大型语言模型（LLMs）的实际基准测试较少。该帖子获得了大量的点赞和众多评论，引发了关于其性能、价格、应用场景等多方面的热烈讨论。

讨论的焦点主要集中在以下几个方面：有人认为 18t/s 的速度对于代码生成相当实用，尤其对于处理超敏感或受监管数据的人员来说，尽管价格高昂，但每个实例 10k 美元的成本在某些情况下是合理的。然而，也有人指出 Mac Ultras 的提示处理速度仍比 Nvidia 卡慢很多，可能更适用于批量处理夜间任务。

有用户分享道：“作为一名长期关注电脑硬件的爱好者，我发现苹果电脑在性能和价格方面一直有着独特的定位。这次的 Mac Studio M3 Ultra 虽说性能有提升，但价格依然让人望而却步。” 还有用户提供了相关的测试数据：“Macbook pro 中，M4 MAX 的提示处理速度为 14.8 个令牌/秒，M2 则为 2.63 个令牌/秒。”

在讨论中，也存在一些争议点。比如对于性能提升的程度以及价格是否合理，大家看法不一。有人觉得这是巨大的进步，而有人则认为仍不够出色。同时，对于该设备在不同场景下的适用性，也存在不同观点。

不过，大家也达成了一些共识，认为这一产品的出现为市场竞争带来了新的变化，促进了成本的降低。

总之，关于 Mac Studio M3 Ultra 的讨论充分展现了大家对其性能和市场表现的关注与期待，也反映了电脑硬件市场的多样性和复杂性。

讨论总结#

主要观点#

金句与有趣评论#

情感分析#

趋势与预测#

详细内容：#