中文翻译暂不可用,显示俄语原文。

Upper Confidence Bound

Upper Confidence Bound

Определение

Алгоритм, балансирующий исследование и эксплуатацию путём выбора варианта с максимальным значением оценки плюс доверительный интервал. Широко применяется в MCTS для LLM-агентов и в bandit-задачах.

Где встречается

Навигация