Quantile Quantization

Quantile Quantization

Определение

Quantile Quantization — метод квантования, при котором уровни квантования выбираются таким образом, чтобы каждый квантиль (интервал) содержал одинаковое количество значений из исходного распределения. Это позволяет более эффективно использовать битовую глубину, особенно для распределений с неравномерной плотностью. Метод лежит в основе 4-bit NormalFloat (NF4) квантования, используемого в QLoRA.

Где встречается

Навигация