losing response

Определение

В задачах предпочтения (DPO) — ответ, который считается менее предпочтительным в паре сравнения, обозначается y_l.