中文翻译暂不可用,显示俄语原文。

4-bit quantization

4-bit quantization

Определение

Техника сжатия модели, при которой веса представляются 4 битами. Используется в QLoRA для уменьшения потребления памяти при обучении и инференсе. NF4 — специализированный формат для минимальной потери качества.

Где встречается

Навигация