中文翻译暂不可用,显示俄语原文。

Causal attention

Causal attention

Определение

Архитектурная особенность авторегрессивных моделей (например, GPT), где каждый токен может «видеть» только предыдущие токены. Может способствовать positional bias при оценке.

Где встречается

Навигация