Critique-revision
Critique-revision
Определение
Critique-revision (цикл критики и исправления) — это двухэтапный процесс, используемый в методах обучения с подкреплением на основе обратной связи от человека (RLHF) и конституционного ИИ (Constitutional AI). На первом этапе модель генерирует критику собственного вывода или вывода другой модели, а на втором этапе исправляет его в соответствии с этой критикой. Такой цикл позволяет улучшать качество ответов без непосредственного участия человека.