token-level scheduler

token-level scheduler

Определение

Компонент инференс-системы (например, TGI), который на каждой итерации выбирает, какие токены из активных запросов будут участвовать в forward pass. Обычно использует FIFO-очередь с приоритетами.

Где встречается

Навигация