中文翻译暂不可用,显示俄语原文。
acceptance rate
acceptance rate
Определение
Метрика эффективности speculative decoding, показывающая долю токенов, сгенерированных draft моделью, которые были приняты target моделью. Высокий acceptance rate (например, 78-82%) означает меньшее число итераций и ускорение инференса.
Где встречается
- 158. Что такое EAGLE-3 и чем он отличается от стандартного speculative decoding
- 160. Что такое Variational Speculative Decoding (VSD) и чем он революционен
- 161. Как вы измеряете эффективность speculative decoding
- 164. Какие trade-offs между разными архитектурами speculative decoding
- 212. Как работает speculative decoding с несколькими draft моделями
- 289. Как работает speculative decoding на уровне логитов, а не токенов
- 440. Как работает speculative decoding Как выбрать draft модель
- 441. EAGLE-3 vs Medusa-2 vs Hydra сравнение speculative decoding методов.
- 456. Что такое Medusa (multiple heads) для speculative decoding
- 534. Как вы делаете data quality для синтетических датасетов
- 687. Как вы делаете synthetic eval (генерация тестовых вопросов по документам)
- 838. Как speculative decoding ускоряет inference (детально)
- 800+ вопросов
- 220. Настроить wave decoding для коротких ответов