Critique-revision

Critique-revision

Определение

Critique-revision (цикл критики и исправления) — это двухэтапный процесс, используемый в методах обучения с подкреплением на основе обратной связи от человека (RLHF) и конституционного ИИ (Constitutional AI). На первом этапе модель генерирует критику собственного вывода или вывода другой модели, а на втором этапе исправляет его в соответствии с этой критикой. Такой цикл позволяет улучшать качество ответов без непосредственного участия человека.

Где встречается

Навигация