parallel forward pass
parallel forward pass
Определение
Метод инференса, при котором target-модель обрабатывает несколько токенов за один проход, например, в speculative decoding.
Метод инференса, при котором target-модель обрабатывает несколько токенов за один проход, например, в speculative decoding.