English translation is not available yet. Showing Russian content.

декодирующая голова

декодирующая голова

Определение

Выходной линейный слой LLM, который преобразует скрытое состояние в вероятности для каждого токена словаря. Используется для предсказания следующего токена.

Где встречается

Навигация