Extrapolation

Extrapolation

Определение

Способность модели обрабатывать последовательности длиннее тех, на которых она обучалась, например, за счёт позиционных эмбеддингов типа RoPE. Позволяет модели работать с контекстами, выходящими за пределы тренировочной длины.

Где встречается

Навигация