中文翻译暂不可用,显示俄语原文。

Reinforcement Learning with Explanation Reward

Reinforcement Learning with Explanation Reward

Определение

Вариант RL, в котором в функцию вознаграждения добавляется штраф за несоответствие объяснения действия и самого действия, чтобы стимулировать правдивые объяснения агента.

Где встречается

Навигация