English translation is not available yet. Showing Russian content.
open-ended task evaluation
open-ended task evaluation
Определение
Оценка качества модели на свободных, неограниченных задачах вне стандартных бенчмарков, например, с помощью MT-Bench.