OpenAI Evals

OpenAI Evals

Определение

Набор стандартизированных бенчмарков и фреймворк для создания кастомных бенчмарков с поддержкой LLM-судей, используется для оценки качества LLM и синтетических данных.

Где встречается

Навигация