HellaSwag

HellaSwag

Определение

Бенчмарк для оценки способности модели к рассуждению на основе здравого смысла и причинно-следственных связей. Используется для проверки сохранения базовых способностей после fine-tuning.

Где встречается

Навигация