SQuAD
SQuAD
Определение
Популярный датасет для вопросно-ответных задач по тексту, используемый при обучении и оценке моделей.
Где встречается
- 103. Какие оптимизаторы (teleprompters) в DSPy вы использовали и когда BootstrapFewShot, MIPRO, COPRO
- 220. Как вы выбираете между online и batch инференсом для LLM
- 509. Как вы сравниваете две модели, если у них разная latency (быстрая неточная vs медленная точная)
- 683. Что такое data augmentation для LLM (back-translation, paraphrasing, masking)
- 693. Как вы обнаруживаете contamination (пересечение synthetic данных с тестовыми)
- 163. Реализовать AB тестирование промптов
- 227. RAG с гибридным поиском
- 236. RAG с оценкой faithfulness
- 259. Реализовать Bloom filter для retrieval