Reinforcement Learning with Explanation Reward

Reinforcement Learning with Explanation Reward

Определение

Вариант RL, в котором в функцию вознаграждения добавляется штраф за несоответствие объяснения действия и самого действия, чтобы стимулировать правдивые объяснения агента.

Где встречается

Навигация