English translation is not available yet. Showing Russian content.
acceptance rate
acceptance rate
Определение
Метрика эффективности speculative decoding, показывающая долю токенов, сгенерированных draft моделью, которые были приняты target моделью. Высокий acceptance rate (например, 78-82%) означает меньшее число итераций и ускорение инференса.
Где встречается
- 158. Что такое EAGLE-3 и чем он отличается от стандартного speculative decoding
- 160. Что такое Variational Speculative Decoding (VSD) и чем он революционен
- 161. Как вы измеряете эффективность speculative decoding
- 164. Какие trade-offs между разными архитектурами speculative decoding
- 212. Как работает speculative decoding с несколькими draft моделями
- 289. Как работает speculative decoding на уровне логитов, а не токенов
- 440. Как работает speculative decoding Как выбрать draft модель
- 441. EAGLE-3 vs Medusa-2 vs Hydra сравнение speculative decoding методов.
- 456. Что такое Medusa (multiple heads) для speculative decoding
- 534. Как вы делаете data quality для синтетических датасетов
- 687. Как вы делаете synthetic eval (генерация тестовых вопросов по документам)
- 838. Как speculative decoding ускоряет inference (детально)
- 800+ вопросов
- 220. Настроить wave decoding для коротких ответов