硬件与部署 硬件选择

AMD Ryzen AI NPU (Ryzen 7 7840HS)

讨论围绕AMD Ryzen AI NPU在运行大型语言模型时的性能限制和适用性展开,多数观点认为NPU更适合简单AI任务,而非复杂模型。

 ·  · 
硬件与部署 硬件选择

穷人的VRAM或如何以$40运行Llama 3.1 8B Q8达到35 tk/s

讨论围绕使用P102-100 10GB VRAM Nvidia挖矿GPU运行Llama 3.1 8B Q8的经验展开,主要关注其性价比、性能优化及未来升级潜力。

 ·  · 
硬件与部署 硬件选择

DDR6和CPU/主板支持即将到来 - 这将如何改变现状?

讨论围绕DDR6内存及其对CPU和主板支持的影响展开,主要关注其对高性能计算设备成本和性能的影响,以及对未来硬件购买决策的影响。

 ·  · 
硬件与部署 硬件选择

Meta拥有的计算机资源多得惊人:他们每周都能训练完整的Llama 3.1系列

讨论围绕Meta公司庞大的计算资源,特别是其拥有的H100 GPU数量,以及这些资源如何支持Llama 3.1系列模型的频繁训练,涉及技术优势、资源利用和潜在影响。

 ·  · 
硬件与部署 硬件选择

TechInsights 给予 BitNet 加速器市场准备度 6 分

讨论围绕TechInsights对BitNet加速器的市场准备指数评分为6展开,涉及技术投资、规模扩展性和评分标准等多个方面。

 ·  · 
硬件与部署 硬件选择

英伟达CEO称新芯片将拥有"大量大量"的供应

讨论围绕Nvidia新芯片的供应和VRAM需求展开,涉及市场策略、价格担忧和潜在的竞争影响。

 ·  · 
硬件与部署 硬件选择

我离开游戏一段时间了。如果你有一块16GB显存的GPU,你最喜欢使用哪个模型?

Reddit用户讨论了在拥有16GB VRAM GPU的情况下,推荐使用的各种模型及其在不同任务中的表现,包括角色扮演、写作、编程等。

 ·  · 
硬件与部署 硬件选择

SambaNova 提供 llama3.1 405B,速度为 114 tps

讨论围绕SambaNova公司的技术能力,特别是其硬件设计和内存配置,以及与Groq和Cerebras的竞争关系,同时涉及了量化、性能和API申请等话题。

 ·  · 
硬件与部署 硬件选择

最适合进行无审查对话的模型

讨论围绕如何在特定硬件条件下选择最佳模型进行无审查对话展开,涉及模型推荐、硬件兼容性、量化技术等多个方面。

 ·  · 
硬件与部署 硬件选择

你们在单张3090上运行哪些模型

Reddit用户讨论了在单张3090显卡上运行各种机器学习模型的性能、优化策略及用户体验,涉及模型大小、速度、功耗等多个方面。

 ·  ·