中文翻译暂不可用,显示俄语原文。

HumanEval

HumanEval

Определение

Бенчмарк для оценки способности моделей генерировать код по описанию. Используется для измерения производительности в задачах генерации кода, включая метрику pass@k.

Где встречается

Навигация