Grow
Grow
Определение
Grow — это фаза в алгоритме ReST (Reinforced Self-Training), в ходе которой для каждой инструкции генерируется несколько вариантов ответа (например, 5). Полученные кандидаты затем оцениваются и отбираются на этапе Improve для последующего дообучения модели. Grow step позволяет расширить обучающий набор данных за счёт собственных генераций модели, обеспечивая итеративное улучшение.