attention masking

attention masking

Определение

Техника, ограничивающая область внимания модели; используется для игнорирования padding при packing последовательностей или для реализации авторегрессионной генерации (causal attention).

Где встречается

Навигация