English translation is not available yet. Showing Russian content.

Upper Confidence Bound

Upper Confidence Bound

Определение

Алгоритм, балансирующий исследование и эксплуатацию путём выбора варианта с максимальным значением оценки плюс доверительный интервал. Широко применяется в MCTS для LLM-агентов и в bandit-задачах.

Где встречается

Навигация