FP8 quantization

FP8 quantization

Определение

Метод квантизации (квантования) весов и активаций модели до 8-битного формата с плавающей точкой. Позволяет вдвое ускорить матричные умножения на H100 и уменьшить использование памяти с компромиссом по точности.

Где встречается

Навигация