Multiple Heads
Multiple Heads
Определение
Несколько выходных голов (heads) нейронной сети, добавляемых к целевой модели для параллельной генерации токенов. Используется в методах speculative decoding, таких как Medusa-2.
Несколько выходных голов (heads) нейронной сети, добавляемых к целевой модели для параллельной генерации токенов. Используется в методах speculative decoding, таких как Medusa-2.