Thompson sampling

Thompson sampling

Определение

Байесовский метод multi-armed bandit, выбирающий действие пропорционально вероятности быть оптимальным; используется для баланса exploration/exploitation.

Где встречается

Навигация