LongBench

LongBench

Определение

Бенчмарк из 21 задачи (QA, суммаризация, few-shot learning) с длиной контекста от 5k до 15k токенов для оценки способности моделей работать с длинными контекстами.

Где встречается

Навигация