GEMM

GEMM

Определение

General Matrix Multiply — операция матричного умножения, являющаяся основной вычислительной нагрузкой в нейросетях. Ускоряется через Tensor Cores на GPU (например, H100/B200) с использованием FP8.

Где встречается

Навигация