multi-armed bandits
multi-armed bandits
Определение
Класс задач принятия решений, в котором нужно выбирать между несколькими вариантами (руками) для максимизации суммарной награды; лежит в основе алгоритмов вроде Upper Confidence Bound (UCB).
Класс задач принятия решений, в котором нужно выбирать между несколькими вариантами (руками) для максимизации суммарной награды; лежит в основе алгоритмов вроде Upper Confidence Bound (UCB).