L-Eval

L-Eval

Определение

Бенчмарк для оценки способности LLM к рассуждению на длинных контекстах, включающий 18 задач multi-document reasoning.

Где встречается

Навигация