self-training
self-training
Определение
Метод, при котором модель обучается на собственных предсказаниях, отфильтрованных по критерию.
Где встречается
- 339. Как работает алгоритм ReST (Reinforced Self-Training) и когда он лучше PPO
- 513. Что такое weak supervision для разметки данных для fine-tuning и как его применить