中文翻译暂不可用,显示俄语原文。

LLM-as-a-judge

LLM-as-a-judge

Определение

Метод автоматической оценки качества генерации, где большая языковая модель (например, GPT-4) сравнивает ответы с эталоном или критериями. Применяется для оценки RAG, fine-tuning и агентов.

Где встречается

Навигация