English translation is not available yet. Showing Russian content.

4-bit quantization

4-bit quantization

Определение

Техника сжатия модели, при которой веса представляются 4 битами. Используется в QLoRA для уменьшения потребления памяти при обучении и инференсе. NF4 — специализированный формат для минимальной потери качества.

Где встречается

Навигация