中文翻译暂不可用,显示俄语原文。

Quantization-aware training

Quantization-aware training

Определение

Метод обучения модели с имитацией эффектов квантизации (например, FP8 или INT4) на этапе прямого прохода. Позволяет минимизировать потерю точности при последующем инференсе в низкой точности, но требует дополнительных вычислительных ресурсов.

Где встречается

Навигация