中文翻译暂不可用,显示俄语原文。
lm_evaluation_harness
lm_evaluation_harness
Определение
Библиотека для унифицированного запуска бенчмарков (GSM8K, MATH, HumanEval) на различных моделях.
中文翻译暂不可用,显示俄语原文。
Библиотека для унифицированного запуска бенчмарков (GSM8K, MATH, HumanEval) на различных моделях.