outliers
outliers
Определение
Значения тензоров, сильно отклоняющиеся от распределения. Требуют специальной обработки (outlier-aware scaling) для предотвращения переполнения при квантизации.
Где встречается
- 312. Как работает FP8 quantization на H100 (Transformer Engine)
- 458. Что такое FP8 инференс на H100 (Transformer Engine)
- 800+ вопросов