中文翻译暂不可用,显示俄语原文。
Reinforcement Learning with Explanation Reward
Reinforcement Learning with Explanation Reward
Определение
Вариант RL, в котором в функцию вознаграждения добавляется штраф за несоответствие объяснения действия и самого действия, чтобы стимулировать правдивые объяснения агента.