dequantization

dequantization

Определение

Операция преобразования низкоточных чисел (например, INT4) обратно в формат с плавающей точкой (FP16) перед выполнением матричных умножений, что создаёт дополнительную вычислительную нагрузку.

Где встречается

Навигация