Self-Critical Sequence Training
Self-Critical Sequence Training
Определение
Self-Critical Sequence Training (SCST) — это метод обучения моделей генерации последовательностей, при котором в качестве baseline для снижения дисперсии градиентов при обучении с подкреплением используется собственная сэмплированная моделью последовательность. Такой подход позволяет преодолеть проблему экспозиционного смещения (exposure bias), возникающую при обучении с учителем (teacher forcing), и улучшает качество сгенерированных текстов. SCST часто применяется в задачах машинного перевода, суммаризации и генерации диалогов.