Поиск
- wikiDeep health check
# Deep health check ## Определение Custom: /deep (один запрос к модели). ## Где встречается - [[250. Как вы делаете health check для LLM…
- wikihealth check
# health check ## Определение Эндпоинт или процедура проверки работоспособности сервиса, возвращающая статус доступности. Используется для мониторинга и автоматического переключения при отказах…
- practiceТЕХНИЧЕСКОЕ ЗАДАНИЕ: Настроить health checks для всех компонентов
…Настроить health checks для всех компонентов ## 1. Цель задачи Обеспечить 100% [[Вики/coverage\|покрытие]] [[Вики/health check\|health checks]] для…
- practiceТЕХНИЧЕСКОЕ ЗАДАНИЕ: Настроить health checks для LLM
…Цель задачи Научиться проектировать и реализовывать три типа health-эндпоинтов для LLM-сервиса ([[Вики/health check\|liveness]], [[Вики/health check…
- answerКак вы делаете health check для LLM сервера с учетом модели (не только процесс)?
…Health check (проверка здоровья) **[[Вики/health check\|Health]] [[Вики/Check\|check]]** — это механизм, позволяющий системе мониторинга или оркестратору (например, [[Вики…
- wikiHealth check failure
# Health check failure ## Определение Событие, при котором проверка здоровья не прошла, что инициирует переключение на резервный ресурс или регион. ## Где…
- wikiprobe_success
# probe_success ## Определение Метрика Prometheus, показывающая успешность health check (1/0). ## Где встречается - [[264. Настроить health checks для всех компонентов…
- wikifailureThreshold
# failureThreshold ## Определение Параметр, определяющий количество последовательных сбоев, после которого компонент считается недоступным (например, в health checks). ## Где встречается - [[202. Настроить…
- wikiprobe_duration_seconds
# probe_duration_seconds ## Определение Метрика Prometheus, показывающая время выполнения health check. ## Где встречается - [[264. Настроить health checks для всех компонентов…
- answerКак сделать агента самовосстанавливающимся (self-healing)?
…health = await check_redis_health() if health != HealthStatus.HEALTHY: last_checkpoint = await download_checkpoint("memory_20250315_093000.json") new_redis…
- wikisynthetic request
# synthetic request ## Определение Тестовый запрос к LLM, используемый в health checks для проверки, что модель отвечает непустым результатом. ## Где встречается…
- wikiKubernetes probe
# Kubernetes probe ## Определение Механизм Kubernetes для проверки состояния контейнера (liveness, readiness, startup), используемый для настройки health checks и автоматического восстановления…
- wikireadiness delayed
# readiness delayed ## Определение Конфигурация health check, при которой эндпоинт /ready возвращает 503 в течение первых нескольких секунд после старта, а…
- wikiReadiness probe
…Как вы делаете health check для LLM сервера с учетом модели (не только процесс)|250. Как вы делаете health check…
- wikiBlackbox Exporter
# Blackbox Exporter ## Определение Экспортер Prometheus для проверки доступности эндпоинтов по HTTP/HTTPS/TCP/ICMP, используемый для health checks и измерения…
- wikiLiveness probe
…Как вы делаете health check для LLM сервера с учетом модели (не только процесс)|250. Как вы делаете health check…
- wikiGPU memory leak
…Требует мониторинга и health check'ов. ## Где встречается - [[250. Как вы делаете health check для LLM сервера с учетом модели…
- answerКак вы делаете health check для LLM сервера с учетом модели (не только процесс)?
…Health Check (проверка работоспособности) **[[Вики/health check\|Health check]]** — это эндпоинты (HTTP-ручки), которые опрашивает [[Вики/Orchestrator\|оркестратор]] ([[Вики/Kubernetes…
- practiceТЕХНИЧЕСКОЕ ЗАДАНИЕ: Настроить multi-region active-passive для inter-agent communication
…Добавьте [[Вики/health check\|health check]] - [[Вики/agent\|Агент]] каждого региона возвращает `{"[[Вики/Span status\|status]]": "ok"}` на `[[Вики/health…
- wikikubectl
…Настроить health checks для LLM|202. Настроить health checks для LLM]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00. Индекс разборов…
- wikik9s
…Настроить health checks для LLM|202. Настроить health checks для LLM]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00. Индекс разборов…
- wikikube-prometheus-stack
…Настроить health checks для LLM|202. Настроить health checks для LLM]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00. Индекс разборов…
- wikifour golden signals
…Настроить health checks для всех компонентов|264. Настроить health checks для всех компонентов]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00…
- wikiCrashLoopBackOff
…Настроить health checks для LLM|202. Настроить health checks для LLM]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00. Индекс разборов…
- wikiinitialDelaySeconds
…Настроить health checks для LLM|202. Настроить health checks для LLM]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00. Индекс разборов…
- wikiStartup probe
…Как вы делаете health check для LLM сервера с учетом модели (не только процесс)|250. Как вы делаете health check…
- wikiport-forward
…Настроить health checks для LLM|202. Настроить health checks для LLM]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00. Индекс разборов…
- answerКак проектировать graceful degradation при отказе vector DB?
…Health checks и детекция отказа **Health check** — регулярная [[Вики/health check\|проверка доступности]] сервиса. Для vector DB обычно используется TCP…
- answerКак вы делаете multi-region failover с RTO <5 минут?
…primary (основной регион) и secondary (резервный). - К каждой записи привязан [[Вики/health check\|health check]] (например, проверка ALB в регионе…
- answerКак организовать multi-region active-passive для LLM API?
…Health checks и failover ### 4.1 Health check endpoint Каждый регион предоставляет endpoint `/health`: - Проверяет доступность LLM инференса (здоров ли…
- answerКак вы делаете агента "отказоустойчивым" (graceful degradation)?
…self._healthy = {} async def check_health(self, service_name: str, health_url: str) -> bool: try: async with aiohttp.ClientSession() as…
- wikialert rules
…Настроить health checks для всех компонентов|264. Настроить health checks для всех компонентов]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00…
- answerКак вы проектируете disaster recovery для LLM системы при сбое региона?
…Как реализуется: - **[[Вики/health check\|Health check]]**: ежеминутный HTTPS-запрос к эндпоинту `/healthz`. Если ответ не получен или [[Вики/Code…
- wikiMinikube
…Как вы делаете health check для LLM сервера с учетом модели (не только процесс)|250. Как вы делаете health check…
- wikiService
…Настроить health checks для LLM|202. Настроить health checks для LLM]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00. Индекс разборов…
- answerКак вы спроектируете систему, которая может переключаться между разными LLM провайдерами без даунтайма?
…LLMProvider, check_interval: int = 30): self.provider = provider self._healthy = True self._last_check = 0.0 self._check_interval = check…
- wikiCurl
…Настроить health checks для LLM|202. Настроить health checks для LLM]] - [[206. Развернуть vLLM vs TGI, сравнить throughput|206. Развернуть…
- wikiUvicorn
…Настроить health checks для LLM|202. Настроить health checks для LLM]] - [[203. Реализовать retry storm mitigation|203. Реализовать retry storm…
- wikiDNS failover
# DNS failover ## Определение DNS failover — механизм автоматического переключения трафика на другой регион или сервер при обнаружении сбоя по health check…
- answerКак проектировать SLA между агентом-менеджером и агентами-исполнителями?
…Мониторинг и health checks Каждый [[Вики/agent\|исполнитель]] обязан предоставлять: - [[Вики/health check\|Health check endpoint]] (например, `[[Вики/health check…
- wikipushgateway
…Настроить health checks для всех компонентов|264. Настроить health checks для всех компонентов]] - [[300. Полная платформа для оценки RAG|300…
- practiceТЕХНИЧЕСКОЕ ЗАДАНИЕ: Реализовать blue-green deployment для RAG
…Настройте [[Вики/health check\|health]]‑[[Вики/Check\|check]]: [[Вики/Kong\|nginx]] proxy_pass с проверкой `[[Вики/health check\|/health]]` на…
- wikiFailure mode
…Настроить health checks для всех компонентов|264. Настроить health checks для всех компонентов]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00…
- wikiKubernetes
# Kubernetes ## Определение Платформа оркестрации контейнеров, используемая для развёртывания, масштабирования и управления LLM-серверами с поддержкой graceful shutdown и health checks…
- wikiModel warm-up
…Как вы делаете health check для LLM сервера с учетом модели (не только процесс)|250. Как вы делаете health check…
- wikiRecovery actions
# Recovery actions ## Определение После health check агент запускает одно из recovery actions, например, восстановление из checkpoint или переключение на backup…
- wikiDeadlock
…Как вы делаете health check для LLM сервера с учетом модели (не только процесс)|250. Как вы делаете health check…
- wikiKind
…Настроить health checks для LLM|202. Настроить health checks для LLM]] - [[205. Настроить GPU scheduling для multi-tenant|205. Настроить…
- answerЧто такое «Tool Degradation with Availability Masking» и как ее обнаружить?
…Как Availability Masking маскирует проблему Стандартный [[Вики/health check\|availability check]] проверяет только: - [[Вики/availability\|Доступность]] эндпоинта ([[Вики/TCP\|TCP…
- wikiMock API
…Настроить health checks для LLM|202. Настроить health checks для LLM]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00. Индекс разборов…