SCROLLS
SCROLLS
Определение
Бенчмарк для оценки моделей на длинных документах, сфокусированный на задачах QA и понимания контекста.
Где встречается
- 633. Как вы оцениваете reasoning capability (не просто recall) на длинном контексте
- 715. Hyena как заменить attention на свертки, сохранив качество