中文翻译暂不可用,显示俄语原文。
bitsandbytes 4-bit quantization
bitsandbytes 4-bit quantization
Определение
Метод снижения потребления памяти GPU за счёт квантизации модели до 4-битной точности, позволяющий одновременно загружать несколько моделей.
中文翻译暂不可用,显示俄语原文。
Метод снижения потребления памяти GPU за счёт квантизации модели до 4-битной точности, позволяющий одновременно загружать несколько моделей.