unembedding
unembedding
Определение
Линейное преобразование скрытых состояний модели в логиты токенов выходного словаря; ключевой компонент для интерпретации внутренних представлений через logit lens.
Где встречается
- 295. Что такое logit lens и как он помогает понимать внутренние представления
- 674. Что такое logit lens (интерпретация скрытых состояний)
- 800+ вопросов