中文翻译暂不可用,显示俄语原文。

pairwise ranking loss

pairwise ranking loss

Определение

Функция потерь для обучения reward model, основанная на разнице скоров chosen и rejected ответов и моделирующая вероятности предпочтений по Брэдли-Терри.

Где встречается

Навигация