preference data collection

preference data collection

Определение

Процесс сбора человеческих предпочтений в виде триплетов (prompt, chosen, rejected) для обучения reward model или DPO. Ключевой этап RLHF, подверженный субъективности и bias.

Где встречается

Навигация