中文翻译暂不可用,显示俄语原文。

OpenAI Evals

OpenAI Evals

Определение

Набор стандартизированных бенчмарков и фреймворк для создания кастомных бенчмарков с поддержкой LLM-судей, используется для оценки качества LLM и синтетических данных.

Где встречается

Навигация