HotpotQA
HotpotQA
Определение
Бенчмарк для multi-hop question answering, требующий поиска и объединения информации из нескольких документов; используется для оценки способности моделей к многошаговому рассуждению.
Где встречается
- 47. Что такое ReAct Agent и как он работает
- 152. В чем разница между Chain-of-Thought (CoT) и Latent Reasoning