English translation is not available yet. Showing Russian content.
Causal attention
Causal attention
Определение
Архитектурная особенность авторегрессивных моделей (например, GPT), где каждый токен может «видеть» только предыдущие токены. Может способствовать positional bias при оценке.