lm_evaluation_harness
lm_evaluation_harness
Определение
Библиотека для унифицированного запуска бенчмарков (GSM8K, MATH, HumanEval) на различных моделях.
Библиотека для унифицированного запуска бенчмарков (GSM8K, MATH, HumanEval) на различных моделях.