LLM evaluation
LLM evaluation
Определение
Процесс оценки качества и поведения языковых моделей с использованием метрик и тестовых наборов. Включает методы вроде IRT для сравнения моделей на разных вопросах.
Процесс оценки качества и поведения языковых моделей с использованием метрик и тестовых наборов. Включает методы вроде IRT для сравнения моделей на разных вопросах.