edge cases
edge cases
Определение
Множество редких и сложных входных данных (пустой запрос, очень длинный текст, неоднозначная формулировка), используемых для оценки робастности модели.
Где встречается
- 140. Как вы проверяете, что новая версия модели не сломала старые кейсы
- 341. Как вы проектируете бенчмарк для нового домена (медицина, юриспруденция)
- 695. Как вы делаете synthetic data для multi-turn диалогов (агентов)
- 789. Как тестировать multi-turn диалоги агента
- 798. Как тестировать промпты на регрессии (prompt regression suite)
- 880. Как проектировать golden dataset для agent evaluation
- 800+ вопросов