Оглавление
Вопросы
Практика
Вики
Материалы сообщества
Тесты
Поиск

✈Telegram @ai_varo

…

Оглавление/Вики/Prometheus

Prometheus

Prometheus

Определение

Система мониторинга и сбора метрик с временными рядами, широко используемая для отслеживания производительности и состояния LLM-сервисов в production.

Где встречается

43. Как спроектировать агента, который может выполнять цепочку из 5-10 действий
106. Как вы валидируете, что DSPy-оптимизация действительно улучшила модель, а не просто переобучилась под метрику
109. Как вы бенчмарките DSPy против ручного промпт-инжиниринга в production
139. Как вы оцениваете cost-effectiveness LLM-пайплайна
205. Как вы деплоите LLM с requirement 100ms latency при throughput 1000 reqs Архитектура.
220. Как вы выбираете между online и batch инференсом для LLM
237. Что такое circuit breaker и как он применяется к LLM API вызовам
240. Как вы проектируете dead letter queue для failed LLM инференс запросов
241. Как вы делаете distributed tracing для цепочки user → gateway → RAG → LLM → user
243. Как вы делаете blue-green deployment для RAG системы с zero downtime
244. Как вы проектируете backpressure в LLM serving системе
247. Как вы проектируете multi-region active-active для LLM API
249. Как вы делаете load shedding при перегрузке LLM сервера
250. Как вы делаете health check для LLM сервера с учетом модели (не только процесс)
253. Как вы делаете асинхронную обработку long-running (30s) LLM задач
256. Как вы проектируете ETL пайплайн для 1M документовдень в RAG систему
269. Как вы обрабатываете streaming данные для real-time RAG
272. Как вы проверяете качество parsing документов (PDF, DOCX) в production
273. Как вы обрабатываете corrupted или empty документы в ingestion пайплайне
318. TensorRT-LLM vs vLLM — сравнение для production deployment.
381. Как вы определяете SLO и SLA для LLM сервиса
382. Как вы проектируете canary deployment для LLM модели
383. Что такое error budget для AI качества и как его считать
384. Как вы проводим chaos engineering для RAG системы
385. Как вы автоматизируете rollback при деградации качества
388. Что такое SLI (Service Level Indicators) для AI системы и как их собирать
390. Как вы проектируем on-call ротацию для AI сервиса
391. Как вы проектируете агента, который может работать непрерывно (247) без дрейфа поведения
400. Как вы проектируете систему для continuous learning LLM-агента в production — чтобы агент улучшался от взаимодействий с пользователями без переобучения на шум и без катастрофиче...
403. Как вы проектируете RAG для 10k RPS с P99 latency 200ms Архитектура.
404. Что такое circuit breaker и как он применяется к LLM API вызовам
407. Как вы проектируете dead letter queue для failed LLM инференс запросов
409. Как вы проектируете graceful shutdown для LLM serving pod в Kubernetes
410. Как вы делаете blue-green deployment для RAG системы с zero downtime
411. Как вы проектируете backpressure в LLM serving системе
413. Что такое sidecar pattern для LLM observability и как его реализовать
416. Как вы делаете load shedding при перегрузке LLM сервера
800+ вопросов

Навигация

Индекс терминов
Индекс разборов
Оглавление