closed-form expression
closed-form expression
Определение
Аналитическое выражение для оптимальной политики в терминах reward, позволяющее переписать задачу оптимизации как классификацию без итеративного обучения.
Аналитическое выражение для оптимальной политики в терминах reward, позволяющее переписать задачу оптимизации как классификацию без итеративного обучения.