English translation is not available yet. Showing Russian content.
attention entropy
attention entropy
Определение
Мера распределения весов внимания; низкая энтропия (меньше 1.0) указывает на наличие attention sink — чрезмерной фокусировки на малом числе токенов.