English translation is not available yet. Showing Russian content.

pairwise ranking loss

pairwise ranking loss

Определение

Функция потерь для обучения reward model, основанная на разнице скоров chosen и rejected ответов и моделирующая вероятности предпочтений по Брэдли-Терри.

Где встречается

Навигация