Epsilon-greedy
Epsilon-greedy
Определение
Стратегия балансирования exploration (случайный выбор с вероятностью ε) и exploitation (выбор действия с максимальной полезностью). Используется в агентных системах для выбора API.
Стратегия балансирования exploration (случайный выбор с вероятностью ε) и exploitation (выбор действия с максимальной полезностью). Используется в агентных системах для выбора API.