Plackett–Luce model

Plackett–Luce model

Определение

Plackett–Luce model — это вероятностная модель для ранжирования, обобщающая модель Брэдли–Терри на случай одновременного сравнения более двух элементов. Каждому элементу приписывается скрытый параметр «силы», и вероятность того, что элемент займет первую позицию, пропорциональна его силе; далее процесс повторяется для оставшихся элементов. Модель широко применяется для анализа предпочтений при наличии полных или частичных ранжирований.

Где встречается

    1. Как собирать preference data для RLHF? (A/B сравнение ответов, ranking, Elo score)

Навигация