中文翻译暂不可用,显示俄语原文。
Grow
Grow
Определение
Grow — это фаза в алгоритме ReST (Reinforced Self-Training), в ходе которой для каждой инструкции генерируется несколько вариантов ответа (например, 5). Полученные кандидаты затем оцениваются и отбираются на этапе Improve для последующего дообучения модели. Grow step позволяет расширить обучающий набор данных за счёт собственных генераций модели, обеспечивая итеративное улучшение.