中文翻译暂不可用,显示俄语原文。

Memory Overhead

Memory Overhead

Определение

Дополнительный расход памяти, необходимый для хранения KV-кэша вспомогательной модели (draft) при speculative decoding. В Independent Draft может достигать 2x от базового.

Где встречается

Навигация