中文翻译暂不可用,显示俄语原文。

FP8

FP8

Определение

8-битный формат чисел с плавающей точкой с подвариантами E4M3 (высокая точность) и E5M2 (больший диапазон). Используется на GPU H100 для ускорения матричных умножений (GEMM) в инференсе, обеспечивая пиковую производительность до 1979 TFLOPS.

Где встречается

Навигация