Comparison Dataset

Comparison Dataset

Определение

Датасет, содержащий тройки (prompt, ответ_A, ответ_B, метка), используемый для обучения модели вознаграждения (reward model) на основе человеческих предпочтений.

Где встречается

Навигация