авторегрессивное декодирование

авторегрессивное декодирование

Определение

Стандартный метод генерации текста в LLM, при котором токены вырабатываются последовательно, каждый следующий зависит от предыдущих. Это приводит к задержкам и плохой батчизации на этапе декодирования.

Где встречается

Навигация