English translation is not available yet. Showing Russian content.

Reinforcement Learning

Reinforcement Learning

Определение

Метод обучения агентов через взаимодействие со средой с получением наград или штрафов; применяется для выравнивания LLM и оптимизации поведения агентов (например, с PPO).

Где встречается

Навигация