English translation is not available yet. Showing Russian content.
Upper Confidence Bound
Upper Confidence Bound
Определение
Алгоритм, балансирующий исследование и эксплуатацию путём выбора варианта с максимальным значением оценки плюс доверительный интервал. Широко применяется в MCTS для LLM-агентов и в bandit-задачах.
Где встречается
- 570. Что такое tree search agents (MCTS for LLM) и когда они эффективны
- 723. Как моделировать экономику агентов с ограниченными бюджетами на API вызовы
- 893. Как работает tree search (MCTS) для LLM агентов
- Практика
- 800+ вопросов
- 62. Настроить MCTS для математических задач