English translation is not available yet. Showing Russian content.
Autoregressive inference
Autoregressive inference
Определение
Этап генерации токенов один за другим во время инференса LLM, стандартный для авторегрессионных моделей, в отличие от prefill-стадии.