原贴链接

我注意到模型提供商之间存在许多差异,我猜测这是因为它们为了成本而进行了量化。不幸的是,405b对我来说太大了,我的3090s无法处理,所以有没有不量化模型的API提供商?