offline evaluation
offline evaluation
Определение
Оценка модели на статическом датасете без привлечения реальных пользователей, позволяющая быстро отсеять неэффективные версии перед A/B-тестированием.
Где встречается
- 71. Как вы тестируете RAG-систему на новых документах без реальных пользователей
- 136. Как вы AB тестируете две версии промпта в production
- 800. Что такое Prompt Registry (каталог промптов с версиями)