wmma

Определение

Инструкция warp matrix multiply-accumulate для использования тензорных ядер GPU при вычислении матричных операций, например, в attention.