English translation is not available yet. Showing Russian content.
greedy traversal
greedy traversal
Определение
Стратегия выбора токена с максимальной вероятностью на каждом шаге (эквивалент temperature=0). В HNSW — метод жадного перемещения к цели по слоям. Детерминированный подход, снижающий галлюцинации, но уменьшающий разнообразие генерации.
Где встречается
- 17. Как вы уменьшаете галлюцинации в RAG
- 87. Как вы обеспечиваете, чтобы ответы LLM были консистентными для одинаковых вопросов
- 222. Что такое IVF (Inverted File Index) и как он сравнивается с HNSW по speedquality
- 292. Как работает temperature sampling и как он влияет на качество при разных значениях
- 293. Что такое Top-p (nucleus) sampling и как он сочетается с temperature
- 320. Что такое ONNX Runtime и когда он выгоден для LLM
- 450. Что такое Wave Decoding и чем отличается от стандартного авторегрессивного
- 627. Как вы тестируете long-context capability модели (бенчмарки RULER, Needle in a Haystack)
- 662. Что такое logits и как они связаны с вероятностями temperature scaling
- 678. Как работает greedy decoding vs beam search vs sampling
- 679. Что такое repetition penalty и как он работает
- Практика
- 800+ вопросов
- 56. Реализовать diffusion LLM (PLANNER)
- 63. Реализовать verifier-guided decoding
- 206. Развернуть vLLM vs TGI, сравнить throughput
- 220. Настроить wave decoding для коротких ответов