English translation is not available yet. Showing Russian content.
Top-k sampling
Top-k sampling
Определение
Метод декодирования, ограничивающий выбор следующими k наиболее вероятными токенами, уменьшая хвост распределения.
Где встречается
- 87. Как вы обеспечиваете, чтобы ответы LLM были консистентными для одинаковых вопросов
- 212. Как работает speculative decoding с несколькими draft моделями
- 292. Как работает temperature sampling и как он влияет на качество при разных значениях
- 293. Что такое Top-p (nucleus) sampling и как он сочетается с temperature
- 320. Что такое ONNX Runtime и когда он выгоден для LLM
- 351. Как работает model stealing attack и как защититься
- 662. Что такое logits и как они связаны с вероятностями temperature scaling
- 677. Как работает forward pass LLM от токена до вероятности следующего токена
- 678. Как работает greedy decoding vs beam search vs sampling
- 679. Что такое repetition penalty и как он работает
- 879. Как делать evaluation для long-context RAG (100k токенов)
- 889. Как детектировать и предотвращать vector DB poisoning
- 800+ вопросов
- 62. Настроить MCTS для математических задач
- 67. Реализовать latent reasoning (∇-Reasoner)
- 69. Реализовать deliberate decoding