中文翻译暂不可用,显示俄语原文。
dequantization
dequantization
Определение
Операция преобразования низкоточных чисел (например, INT4) обратно в формат с плавающей точкой (FP16) перед выполнением матричных умножений, что создаёт дополнительную вычислительную нагрузку.