Поиск
- wikiэмулятор LLM-сервиса
# эмулятор LLM-сервиса ## Определение Тестовый сервис на FastAPI, имитирующий запросы к LLM для отладки cost tracking. ## Где встречается - [[132. Настроить…
- wikiavailability
…Как вы определяете SLO и SLA для LLM сервиса|381. Как вы определяете SLO и SLA для LLM сервиса]] - [[532…
- wikiToil reduction
…Как вы определяете SLO и SLA для LLM сервиса|381. Как вы определяете SLO и SLA для LLM сервиса]] ## Навигация…
- wikiLLMProvider
# LLMProvider ## Определение Абстрактный интерфейс или внешний сервис (OpenAI, Anthropic, локальные модели через vLLM), предоставляющий API для вызова языковых моделей и…
- wikiSRE
…Как вы определяете SLO и SLA для LLM сервиса|381. Как вы определяете SLO и SLA для LLM сервиса]] - [[756…
- wikiSLO
…Как вы определяете SLO и SLA для LLM сервиса|381. Как вы определяете SLO и SLA для LLM сервиса]] - [[382…
- wikiproxy API
# proxy API ## Определение Архитектура, при которой сервис выступает прокси к целевой LLM (например, JaaS). ## Где встречается - [[618. Что такое jailbreak…
- wikiprometheus_client
…Используется для мониторинга LLM-сервисов. ## Где встречается - [[381. Как вы определяете SLO и SLA для LLM сервиса|381. Как вы…
- answerКак вы определяете SLO и SLA для LLM сервиса?
…Почему SLO/SLA критичны для LLM-сервиса LLM-сервисы имеют особенности, отличающие их от традиционных веб-сервисов: - [[Вики/Stochasticity\|Стохастичность…
- wikipostmortem
…Как вы определяете SLO и SLA для LLM сервиса|381. Как вы определяете SLO и SLA для LLM сервиса]] - [[390…
- wikiSLI
…Как вы определяете SLO и SLA для LLM сервиса|381. Как вы определяете SLO и SLA для LLM сервиса]] - [[383…
- wikiZapier
# Zapier ## Определение Сервис интеграции веб-приложений, позволяющий создавать автоматизированные цепочки действий без кода. В контексте LLM используется для связывания моделей…
- wikiКаскад моделей
…Как вы определяете SLO и SLA для LLM сервиса|381. Как вы определяете SLO и SLA для LLM сервиса]] ## Навигация…
- wikierror budget
…Как вы определяете SLO и SLA для LLM сервиса|381. Как вы определяете SLO и SLA для LLM сервиса]] - [[383…
- wikiGPU time
…Как вы определяете SLO и SLA для LLM сервиса|381. Как вы определяете SLO и SLA для LLM сервиса]] - [[800…
- answerКак вы делаете distributed tracing для цепочки: user → gateway → RAG → LLM → user?
…Для [[Вики/цепочки\|цепочки]] user → [[Вики/Gateway\|gateway]] → [[Вики/гибридный поиск\|RAG]] → [[Вики/LLM\|LLM]] → user мы инструментируем каждый сервис…
- wikiPromptInject
…при тестировании безопасности LLM. ## Где встречается - [[618. Что такое jailbreak as a service (коммерческие jailbreak сервисы) и как защититься|618…
- wikitoken manipulation
…jailbreak-атаках на LLM. ## Где встречается - [[618. Что такое jailbreak as a service (коммерческие jailbreak сервисы) и как защититься|618…
- wikiSLA
…Как вы определяете SLO и SLA для LLM сервиса|381. Как вы определяете SLO и SLA для LLM сервиса]] - [[390…
- practiceТЕХНИЧЕСКОЕ ЗАДАНИЕ: Настроить RED metrics для LLM
…Настроены alerts. ### Этап 5: (Опционально) Интеграция с существующим LLM сервисом (1-2 часа) Если есть доступ к реальному LLM сервису…
- wikiPagerDuty
# PagerDuty ## Определение Сервис оповещения и управления инцидентами, автоматически уведомляющий дежурных инженеров при критических событиях (например, рост DLQ). ## Где встречается - [[240…
- wikin-grams
…Что такое data exfiltration через LLM (утечка данных через ответы)]] - [[618. Что такое jailbreak as a service (коммерческие jailbreak сервисы…
- answerЗачем нужен embedding-as-a-service и когда вы его используете?
…сервис | | Частое обновление модели (еженедельно/ежемесячно) | Да, EaaS | A/B тестирование новой модели эмбеддингов | | Нагрузка на эмбеддинги растёт быстрее LLM…
- wikiSuccessful task completion rate
…Как вы определяете SLO и SLA для LLM сервиса|381. Как вы определяете SLO и SLA для LLM сервиса]] - [[383…
- wikiCounter
…Как вы определяете SLO и SLA для LLM сервиса|381. Как вы определяете SLO и SLA для LLM сервиса]] - [[24…
- wikiGuardrails AI
…blue + purple teaming для LLM)]] - [[618. Что такое jailbreak as a service (коммерческие jailbreak сервисы) и как защититься|618. Что…
- wikiGauge
…Как вы определяете SLO и SLA для LLM сервиса|381. Как вы определяете SLO и SLA для LLM сервиса]] - [[26…
- answerКак вы проектируете on-call ротацию для AI сервиса?
…Для AI-сервисов важно учитывать специфику: [[Вики/Failure mode\|падение качества]] ответов, [[Вики/drift\|дрейф]] данных, сбои LLM-провайдеров, поэтому…
- wikiAlertmanager
…Как вы определяете SLO и SLA для LLM сервиса|381. Как вы определяете SLO и SLA для LLM сервиса]] - [[385…
- practiceТЕХНИЧЕСКОЕ ЗАДАНИЕ: Спроектировать structured logging для LLM
…Цель задачи Научиться проектировать и внедрять [[Вики/structured logging\|structured logging]] (структурированное логирование) для сервиса, использующего большие языковые модели (LLM…
- wikiwatermarking
…Как работает model watermarking для LLM (идентификация модели-источника)]] - [[618. Что такое jailbreak as a service (коммерческие jailbreak сервисы) и…
- wikiMake
# Make ## Определение Облачный сервис для визуального создания сценариев автоматизации, поддерживающий вызов LLM через HTTP-модули. ## Где встречается - [[59. n8n, Make…
- wikipull-based
…Рекомендуется для LLM-сервисов. ## Где встречается - [[24. Настроить RED metrics для LLM|24. Настроить RED metrics для LLM]] ## Навигация - [[00…
- wikiAnswer quality
…Как вы определяете SLO и SLA для LLM сервиса|381. Как вы определяете SLO и SLA для LLM сервиса]] - [[382…
- answerЧто такое circuit breaker и как он применяется к LLM API вызовам?
…return call_llm_api(prompt) except Exception: # fallback: кэш или другой провайдер return get_from_cache(prompt) or "Сервис временно…
- wikiinitialDelaySeconds
…сервиса. ## Где встречается - [[800+ вопросов|800+ вопросов]] - [[202. Настроить health checks для LLM|202. Настроить health checks для LLM]] ## Навигация…
- wikiHistogram
…Как вы определяете SLO и SLA для LLM сервиса|381. Как вы определяете SLO и SLA для LLM сервиса]] - [[24…
- wikiuser_tenure
# user_tenure ## Определение Признак, отражающий длительность использования сервиса пользователем, часто применяемый в feature store для LLM. ## Где встречается - [[800+ вопросов…
- wikiReal-time ingestion
…Как вы определяете SLO и SLA для LLM сервиса|381. Как вы определяете SLO и SLA для LLM сервиса]] - [[544…
- answerЧто такое jailbreak as a service (коммерческие jailbreak сервисы) и как защититься?
…в ряде юрисдикций (EU AI Act, US Executive Order) компании обязаны предотвращать вредоносное использование LLM. - Регулирование JaaS: продажа jailbreak-сервисов…
- wikiArtificial Analysis
# Artificial Analysis ## Определение Сервис, агрегирующий цены, задержку и качество моделей от разных провайдеров для сравнения. ## Где встречается - [[783. Как сравнивать…
- wikiSpot Fleet
…Сервис AWS, позволяющий управлять разнородными spot-инстансами для отказоустойчивого и экономичного деплоя. ## Где встречается - [[251. Как вы деплоите LLM на…
- wikirolling restart
…инстансов сервиса по одному, обеспечивающая отсутствие downtime. ## Где встречается - [[452. Как вы управляете memory fragmentation при длительном раннинге LLM сервера…
- wikiRoleBinding
…сервисному аккаунту (ServiceAccount) для управления доступом к ресурсам. ## Где встречается - [[422. Как вы управляете секретами (API keys для LLM) в…
- wikiмикросервис
# микросервис ## Определение Архитектурный стиль, при котором приложение строится как набор небольших, независимо развертываемых сервисов, каждый из которых отвечает за свою…
- wikiGreat Expectations
…Что такое data contract между сервисами в RAG пайплайне|532. Что такое data contract между сервисами в RAG пайплайне]] - [[852…
- practiceТЕХНИЧЕСКОЕ ЗАДАНИЕ: Реализовать canary analysis с авто-роллбэком для AI-сервиса
…Цель задачи Получить практический навык настройки канареечного (canary) развёртывания для инференс-сервиса на основе LLM или другого AI-модуля. Необходимо…
- wikiExternal Authorization
# External Authorization ## Определение Фильтр Envoy, делегирующий авторизацию внешнему сервису; применяется для логирования и мониторинга запросов к LLM в sidecar-паттерне…
- wikiRED metrics
# RED metrics ## Определение Метрики для мониторинга production-сервисов на LLM: Rate (частота запросов), Errors (количество ошибок), Duration (задержка). Позволяют оценить…
- answerЧто такое sidecar pattern для LLM observability и как его реализовать?
…Архитектура sidecar для LLM observability Типичная схема: ``` ┌─────────────────────────────────────┐ │ Pod │ │ ┌──────────────┐ ┌──────────────┐ │ │ │ LLM-сервис │ │ Sidecar │ │ │ │ (Flask/Fast) │ │ (Envoy) │ │ │ │ port 8080 │ │ port 8081 │ │ │ └──────┬───────┘ └──────┬───────┘ │ │ │ │ │ │ │ localhost:8081…