English translation is not available yet. Showing Russian content.

Quantization-aware training

Quantization-aware training

Определение

Метод обучения модели с имитацией эффектов квантизации (например, FP8 или INT4) на этапе прямого прохода. Позволяет минимизировать потерю точности при последующем инференсе в низкой точности, но требует дополнительных вычислительных ресурсов.

Где встречается

Навигация