QK^T

Определение

Операция скалярного произведения запросов и ключей (QK^T) в механизме attention. На аппаратном уровне может быть ускорена с помощью Tensor Cores (например, в H100).

Где встречается

800+ вопросов

QK^T

QK^T

Определение

Где встречается

Навигация