decode

Определение

Фаза генерации токенов после prefill, при которой токены генерируются по одному, влияя на TPOT и используемая в непрерывном батчинге.