пайплайн автоматического тестирования
пайплайн автоматического тестирования
Определение
CI/CD-пайплайн, автоматизирующий запуск тестов (включая регрессионные) на Golden Dataset для проверки качества агента или модели при каждом изменении кода. Обеспечивает раннее обнаружение регрессий.
Где встречается
- 800+ вопросов
- 38. Настроить TTL для semantic cache
- 62. Настроить MCTS для математических задач
- 84. Реализовать conversational repair
- 88. Реализовать hallucination indicator
- 146. Реализовать golden dataset для агента
- 165. Реализовать prompt linting
- 186. Настроить message schema registry
- 197. Реализовать graceful degradation при отказе vector DB
- 236. RAG с оценкой faithfulness
- 266. Сгенерировать synthetic датасет для RAG
- 285. Реализовать synthetic benchmark генератор