Top-p (nucleus) sampling
Top-p (nucleus) sampling
Определение
Метод декодирования, выбирающий минимальный набор токенов с суммарной вероятностью ≥ p для контроля разнообразия генерации.
Где встречается
- 87. Как вы обеспечиваете, чтобы ответы LLM были консистентными для одинаковых вопросов
- 90. Как вы проектируете API для внешних систем, использующих вашу LLM
- 132. Как вы калибруете LLM-судью под человеческие оценки
- 173. Как вы оцениваете креативность LLM в production
- 292. Как работает temperature sampling и как он влияет на качество при разных значениях
- 293. Что такое Top-p (nucleus) sampling и как он сочетается с temperature
- 320. Что такое ONNX Runtime и когда он выгоден для LLM
- 627. Как вы тестируете long-context capability модели (бенчмарки RULER, Needle in a Haystack)
- 662. Что такое logits и как они связаны с вероятностями temperature scaling
- 677. Как работает forward pass LLM от токена до вероятности следующего токена
- 678. Как работает greedy decoding vs beam search vs sampling
- 679. Что такое repetition penalty и как он работает
- 688. Что такое synthetic data collapse (когда синтетические данные деградируют со временем)
- 809. Как управлять версиями промптов в production (best practices)
- 800+ вопросов
- 64. Настроить self-consistency для CoT
- 69. Реализовать deliberate decoding
- 156. Настроить prompt regression suite
- 248. Агент с AB тестированием
- 270. Настроить RLAIF для генерации предпочтений