simulation
simulation
Определение
Последовательность состояний, действий и наград агента в симулированной среде, используемая для тестирования или обучения (rollout).
Где встречается
- 272. Как вы проверяете качество parsing документов (PDF, DOCX) в production
- 334. Как вы делаете online RL для агентов (self-improvement loops)
- 382. Как вы проектируете canary deployment для LLM модели
- 502. Как вы AB тестируете две версии промпта в production
- 570. Что такое tree search agents (MCTS for LLM) и когда они эффективны
- 843. Что такое continuous batching и как оно влияет на throughput
- 880. Как проектировать golden dataset для agent evaluation
- 893. Как работает tree search (MCTS) для LLM агентов
- Практика
- 800+ вопросов
- 62. Настроить MCTS для математических задач
- 92. Профилировать GPU utilization падение
- 114. Настроить playground для тестирования агента