winner prediction accuracy
winner prediction accuracy
Определение
Метрика, измеряющая долю случаев, когда модель правильно предсказывает, какой из двух ответов предпочтет человек, используется для оценки качества RLHF.
Метрика, измеряющая долю случаев, когда модель правильно предсказывает, какой из двух ответов предпочтет человек, используется для оценки качества RLHF.