Поиск

  • wikiDeep health check

    # Deep health check ## Определение Custom: /deep (один запрос к модели). ## Где встречается - [[250. Как вы делаете health check для LLM…

  • wikihealth check

    # health check ## Определение Эндпоинт или процедура проверки работоспособности сервиса, возвращающая статус доступности. Используется для мониторинга и автоматического переключения при отказах…

  • practiceТЕХНИЧЕСКОЕ ЗАДАНИЕ: Настроить health checks для всех компонентов

    …Настроить health checks для всех компонентов ## 1. Цель задачи Обеспечить 100% [[Вики/coverage\|покрытие]] [[Вики/health check\|health checks]] для…

  • practiceТЕХНИЧЕСКОЕ ЗАДАНИЕ: Настроить health checks для LLM

    …Цель задачи Научиться проектировать и реализовывать три типа health-эндпоинтов для LLM-сервиса ([[Вики/health check\|liveness]], [[Вики/health check

  • answerКак вы делаете health check для LLM сервера с учетом модели (не только процесс)?

    Health check (проверка здоровья) **[[Вики/health check\|Health]] [[Вики/Check\|check]]** — это механизм, позволяющий системе мониторинга или оркестратору (например, [[Вики…

  • wikiHealth check failure

    # Health check failure ## Определение Событие, при котором проверка здоровья не прошла, что инициирует переключение на резервный ресурс или регион. ## Где…

  • wikiprobe_success

    # probe_success ## Определение Метрика Prometheus, показывающая успешность health check (1/0). ## Где встречается - [[264. Настроить health checks для всех компонентов…

  • wikifailureThreshold

    # failureThreshold ## Определение Параметр, определяющий количество последовательных сбоев, после которого компонент считается недоступным (например, в health checks). ## Где встречается - [[202. Настроить…

  • wikiprobe_duration_seconds

    # probe_duration_seconds ## Определение Метрика Prometheus, показывающая время выполнения health check. ## Где встречается - [[264. Настроить health checks для всех компонентов…

  • answerКак сделать агента самовосстанавливающимся (self-healing)?

    health = await check_redis_health() if health != HealthStatus.HEALTHY: last_checkpoint = await download_checkpoint("memory_20250315_093000.json") new_redis…

  • wikisynthetic request

    # synthetic request ## Определение Тестовый запрос к LLM, используемый в health checks для проверки, что модель отвечает непустым результатом. ## Где встречается…

  • wikiKubernetes probe

    # Kubernetes probe ## Определение Механизм Kubernetes для проверки состояния контейнера (liveness, readiness, startup), используемый для настройки health checks и автоматического восстановления…

  • wikireadiness delayed

    # readiness delayed ## Определение Конфигурация health check, при которой эндпоинт /ready возвращает 503 в течение первых нескольких секунд после старта, а…

  • wikiReadiness probe

    …Как вы делаете health check для LLM сервера с учетом модели (не только процесс)|250. Как вы делаете health check

  • wikiBlackbox Exporter

    # Blackbox Exporter ## Определение Экспортер Prometheus для проверки доступности эндпоинтов по HTTP/HTTPS/TCP/ICMP, используемый для health checks и измерения…

  • wikiLiveness probe

    …Как вы делаете health check для LLM сервера с учетом модели (не только процесс)|250. Как вы делаете health check

  • wikiGPU memory leak

    …Требует мониторинга и health check'ов. ## Где встречается - [[250. Как вы делаете health check для LLM сервера с учетом модели…

  • answerКак вы делаете health check для LLM сервера с учетом модели (не только процесс)?

    Health Check (проверка работоспособности) **[[Вики/health check\|Health check]]** — это эндпоинты (HTTP-ручки), которые опрашивает [[Вики/Orchestrator\|оркестратор]] ([[Вики/Kubernetes…

  • practiceТЕХНИЧЕСКОЕ ЗАДАНИЕ: Настроить multi-region active-passive для inter-agent communication

    …Добавьте [[Вики/health check\|health check]] - [[Вики/agent\|Агент]] каждого региона возвращает `{"[[Вики/Span status\|status]]": "ok"}` на `[[Вики/health

  • wikikubectl

    …Настроить health checks для LLM|202. Настроить health checks для LLM]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00. Индекс разборов…

  • wikik9s

    …Настроить health checks для LLM|202. Настроить health checks для LLM]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00. Индекс разборов…

  • wikikube-prometheus-stack

    …Настроить health checks для LLM|202. Настроить health checks для LLM]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00. Индекс разборов…

  • wikifour golden signals

    …Настроить health checks для всех компонентов|264. Настроить health checks для всех компонентов]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00…

  • wikiCrashLoopBackOff

    …Настроить health checks для LLM|202. Настроить health checks для LLM]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00. Индекс разборов…

  • wikiinitialDelaySeconds

    …Настроить health checks для LLM|202. Настроить health checks для LLM]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00. Индекс разборов…

  • wikiStartup probe

    …Как вы делаете health check для LLM сервера с учетом модели (не только процесс)|250. Как вы делаете health check

  • wikiport-forward

    …Настроить health checks для LLM|202. Настроить health checks для LLM]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00. Индекс разборов…

  • answerКак проектировать graceful degradation при отказе vector DB?

    Health checks и детекция отказа **Health check** — регулярная [[Вики/health check\|проверка доступности]] сервиса. Для vector DB обычно используется TCP…

  • answerКак вы делаете multi-region failover с RTO <5 минут?

    …primary (основной регион) и secondary (резервный). - К каждой записи привязан [[Вики/health check\|health check]] (например, проверка ALB в регионе…

  • answerКак организовать multi-region active-passive для LLM API?

    Health checks и failover ### 4.1 Health check endpoint Каждый регион предоставляет endpoint `/health`: - Проверяет доступность LLM инференса (здоров ли…

  • answerКак вы делаете агента "отказоустойчивым" (graceful degradation)?

    …self._healthy = {} async def check_health(self, service_name: str, health_url: str) -> bool: try: async with aiohttp.ClientSession() as…

  • wikialert rules

    …Настроить health checks для всех компонентов|264. Настроить health checks для всех компонентов]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00…

  • answerКак вы проектируете disaster recovery для LLM системы при сбое региона?

    …Как реализуется: - **[[Вики/health check\|Health check]]**: ежеминутный HTTPS-запрос к эндпоинту `/healthz`. Если ответ не получен или [[Вики/Code…

  • wikiMinikube

    …Как вы делаете health check для LLM сервера с учетом модели (не только процесс)|250. Как вы делаете health check

  • wikiService

    …Настроить health checks для LLM|202. Настроить health checks для LLM]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00. Индекс разборов…

  • answerКак вы спроектируете систему, которая может переключаться между разными LLM провайдерами без даунтайма?

    …LLMProvider, check_interval: int = 30): self.provider = provider self._healthy = True self._last_check = 0.0 self._check_interval = check

  • wikiCurl

    …Настроить health checks для LLM|202. Настроить health checks для LLM]] - [[206. Развернуть vLLM vs TGI, сравнить throughput|206. Развернуть…

  • wikiUvicorn

    …Настроить health checks для LLM|202. Настроить health checks для LLM]] - [[203. Реализовать retry storm mitigation|203. Реализовать retry storm…

  • wikiDNS failover

    # DNS failover ## Определение DNS failover — механизм автоматического переключения трафика на другой регион или сервер при обнаружении сбоя по health check

  • answerКак проектировать SLA между агентом-менеджером и агентами-исполнителями?

    …Мониторинг и health checks Каждый [[Вики/agent\|исполнитель]] обязан предоставлять: - [[Вики/health check\|Health check endpoint]] (например, `[[Вики/health check

  • wikipushgateway

    …Настроить health checks для всех компонентов|264. Настроить health checks для всех компонентов]] - [[300. Полная платформа для оценки RAG|300…

  • practiceТЕХНИЧЕСКОЕ ЗАДАНИЕ: Реализовать blue-green deployment для RAG

    …Настройте [[Вики/health check\|health]]‑[[Вики/Check\|check]]: [[Вики/Kong\|nginx]] proxy_pass с проверкой `[[Вики/health check\|/health]]` на…

  • wikiFailure mode

    …Настроить health checks для всех компонентов|264. Настроить health checks для всех компонентов]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00…

  • wikiKubernetes

    # Kubernetes ## Определение Платформа оркестрации контейнеров, используемая для развёртывания, масштабирования и управления LLM-серверами с поддержкой graceful shutdown и health checks

  • wikiModel warm-up

    …Как вы делаете health check для LLM сервера с учетом модели (не только процесс)|250. Как вы делаете health check

  • wikiRecovery actions

    # Recovery actions ## Определение После health check агент запускает одно из recovery actions, например, восстановление из checkpoint или переключение на backup…

  • wikiDeadlock

    …Как вы делаете health check для LLM сервера с учетом модели (не только процесс)|250. Как вы делаете health check

  • wikiKind

    …Настроить health checks для LLM|202. Настроить health checks для LLM]] - [[205. Настроить GPU scheduling для multi-tenant|205. Настроить…

  • answerЧто такое «Tool Degradation with Availability Masking» и как ее обнаружить?

    …Как Availability Masking маскирует проблему Стандартный [[Вики/health check\|availability check]] проверяет только: - [[Вики/availability\|Доступность]] эндпоинта ([[Вики/TCP\|TCP…

  • wikiMock API

    …Настроить health checks для LLM|202. Настроить health checks для LLM]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00. Индекс разборов…