中文翻译暂不可用,显示俄语原文。
parallel forward pass
parallel forward pass
Определение
Метод инференса, при котором target-модель обрабатывает несколько токенов за один проход, например, в speculative decoding.
中文翻译暂不可用,显示俄语原文。
Метод инференса, при котором target-модель обрабатывает несколько токенов за один проход, например, в speculative decoding.