декодирующая голова

декодирующая голова

Определение

Выходной линейный слой LLM, который преобразует скрытое состояние в вероятности для каждого токена словаря. Используется для предсказания следующего токена.

Где встречается

Навигация