Autoregressive inference
Autoregressive inference
Определение
Этап генерации токенов один за другим во время инференса LLM, стандартный для авторегрессионных моделей, в отличие от prefill-стадии.
Этап генерации токенов один за другим во время инференса LLM, стандартный для авторегрессионных моделей, в отличие от prefill-стадии.