English translation is not available yet. Showing Russian content.
multiple judges
multiple judges
Определение
Метод оценки с использованием нескольких LLM-судей (или экземпляров одной модели) для агрегации оценок. Позволяет снизить bias и повысить робастность оценок.
Где встречается
- 132. Как вы калибруете LLM-судью под человеческие оценки
- 343. Как вы измеряете и исправляете bias в LLM-as-Judge (self-enhancement, position, verbosity)
- 486. Почему LLM-as-Judge может быть biased Назовите 3 основных bias и как их детектировать.
- 493. Что такое Positional bias в LLM-as-Judge и как его исправить
- 870. Как работает LLM-as-judge и почему он biased
- 800+ вопросов