Поиск
- wikiStorage costs
# Storage costs ## Определение Расходы, связанные с хранением данных (векторных индексов, кэша, логов), которые влияют на общую стоимость эксплуатации LLM-пайплайна…
- wikiPersistence
# Persistence ## Определение поддержка репликации, persistence ## Где встречается - [[144. Как вы передаете состояние (state) между шагами агента|144. Как вы передаете…
- wikiMemory & Persistence
# Memory & Persistence ## Определение Хранение данных в памяти, файловой системе и векторных хранилищах для долговременного использования агентом. ## Где встречается - [[800+ вопросов…
- wikiоблачные ресурсы
# облачные ресурсы ## Определение Затраты на облачные вычисления и хранение, учитываемые при расчёте общей стоимости владения (TCO) для RAG/Agent систем…
- wikiRedis KV-cache
# Redis KV-cache ## Определение Простейшая форма кэширования в Redis: хранение пар ключ-значение. Используется для низколатентного кэширования ответов LLM. ## Где…
- wikitemplate versioning
# template versioning ## Определение Хранение версии шаблона в кэше для принудительной инвалидации при его изменении, что позволяет гарантировать актуальность генерируемых данных…
- wikiNullable
# Nullable ## Определение Свойство поля схемы данных, допускающее хранение null-значений; используется для опциональных метаданных в schema registry. ## Где встречается - [[865…
- wikiEventCollector
# EventCollector ## Определение Класс или компонент, отвечающий за сбор, валидацию и временное хранение поведенческих событий от пользователей или агентов перед их…
- wikiext4
# ext4 ## Определение Распространённая файловая система Linux четвёртой версии; в MLops используется для форматирования EBS-томов под хранение чекпоинтов моделей. ## Где…
- wikiDocument-to-version mapping
# Document-to-version mapping ## Определение Хранение соответствия между идентификатором документа и версией модели эмбеддингов для управления пересчётом эмбеддингов при смене…
- wikiагент в production
…вычислительные ресурсы, вызовы API, хранение данных, мониторинг и т.д. ## Где встречается - [[800+ вопросов|800+ вопросов]] ## Навигация - [[00. Индекс терминов…
- wikiprecomputed norms
# precomputed norms ## Определение Хранение норм векторов отдельно от самих векторов для избежания повторных вычислений при cosine similarity. Ускоряет поиск и…
- wikiState Manager
# State Manager ## Определение Компонент, отвечающий за хранение истории сообщений, переменных сессии и контекста перед вызовом LLM. ## Где встречается - [[744. Что…
- wikiAWS Pricing Calculator
…Позволяет оценить затраты на хранение, вычисления и другие ресурсы. ## Где встречается - [[13. Сравнить S3 vs EBS для checkpoint'ов 70B…
- wikiМатериализация матрицы S
# Материализация матрицы S ## Определение Явное создание и хранение матрицы S в памяти; FlashAttention избегает этого для экономии ресурсов. ## Где встречается…
- wikimapping
# mapping ## Определение Хранение связи между маскированными данными и исходными PII в отдельной защищённой БД для возможной деанонимизации. ## Где встречается - [[263…
- wikisession state
# session state ## Определение Внутреннее состояние сессии, обеспечивающее изоляцию между разными диалогами и хранение истории шагов текущей сессии для поддержания контекста…
- wikiMemory-optimized ANN
# Memory-optimized ANN ## Определение Подмножество ANN-алгоритмов, адаптированных для работы с ограниченной RAM (например, <16 ГБ) через квантование, дисковое хранение…
- wikiTiered storage
# Tiered storage ## Определение Стратегия хранения данных на нескольких уровнях (например, SSD — горячие, NVMe — тёплые, S3 — холодные) в зависимости от частоты…
- wikiтаблица страниц
…Позволяет непоследовательное хранение и эффективное управление памятью. ## Где встречается - [[202. Как работает paged attention в vLLM Чем это отличается от…
- wikiGrafana Tempo
…Поддерживает хранение трасс в объектном хранилище (S3) и запросы через TraceQL. ## Где встречается - [[241. Как вы делаете distributed tracing для…
- wikiZooKeeper
…Обеспечивает хранение состояния и синхронизацию компонентов. ## Где встречается - [[389. Как вы делаем disaster recovery с RPO 1 минута|389. Как…
- answerКак вы обрабатываете PII в данных для RAG (GDPR, 152-ФЗ)?
…генерация, не детекция | | [[Вики/Vault\|HashiCorp Vault]] | Хранение секретов и mapping | Безопасное хранение, аудит | Сложность развёртывания | | ELK / Splunk | Логирование и…
- answerКак вы проектируете feature store для ML фичей, используемых LLM?
…Типы фичей для LLM ### 4.1 Эмбеддинги (user_embedding, item_embedding) - Хранение [[Вики/Chroma\|Векторная БД]] ([[Вики/Pinecone\|Pinecone]], [[Вики…
- answerКак быть, если одно и то же изображение встречается в документах с разными подписями?
…Trade-offs и компромиссы - Хранение: несколько подписей увеличивают размер payload в векторной БД. Для миллионов изображений это может быть существенно…
- answerКак вы делаете schema evolution для метаданных документов в RAG?
…Интеграция с векторной БД ### 5.1 Хранение метаданных Векторные БД ([[Вики/qdrant-client\|Pinecone]], [[Вики/qdrant-client\|Weaviate]], [[Вики/qdrant…
- practiceТЕХНИЧЕСКОЕ ЗАДАНИЕ: Сравнить S3 vs EBS для checkpoint'ов 70B
…Технологический стек | Компонент | Инструменты | Назначение | |-----------|-------------|------------| | Объектное хранилище | Amazon S3 (Standard) | Хранение чекпоинта в объектном хранилище | | Блочное хранилище | Amazon EBS (GP3…
- answerЧто такое Prompt Registry (каталог промптов с версиями)?
…Prompt Registry vs хранение в коде | Критерий | Хранение в коде (константы/env) | Prompt Registry | |----------|----------------------------------|-----------------| | Версионирование | нет или ручное | автоматическое, semver…
- answerЧто такое «message bus» для агентов (Kafka, NATS, Redis PubSub)?
…для высокой пропускной способности и долговременного хранения. | Характеристика | Описание | | --- | --- | | Хранение | Сообщения хранятся на диске, можно повторно читать (реплей) | | Гарантии | At…
- answerКак вы дедуплицируете документы перед индексацией в RAG?
…В [[Вики/RAG\|RAG]] часто используют Jaccard >0.8 или [[Вики/vector similarity\|косинусное сходство]] >0.95. - Хранение сигнатур: для…
- answerКак вы управляете cost хранения векторной БД при миллиарде векторов?
…Такой подход позволяет снизить [[Вики/Storage costs\|затраты на хранение]] на 80–90% без существенной [[Вики/Loss\|потери]] качества поиска…
- practiceТЕХНИЧЕСКОЕ ЗАДАНИЕ: Реализовать автоматический postmortem
…Технологический стек | Компонент | Инструменты | Назначение | |-----------|-------------|------------| | Оркестрация инфраструктуры | Docker Compose | Локальный подъём стека observability | | Хранение логов | Elasticsearch (Loki) | Агрегация и поиск…
- answerКак вы управляете секретами (API keys для LLM) в Kubernetes?
…Удобно, но не централизованное хранение. Для production с Agentic RAG (где может быть несколько сервисов с LLM‑ключами) лучший выбор…
- answerКак работает DiskANN и когда он нужен?
…он минимизирует количество случайных чтений с диска. ### 3.2 Хранение векторов на SSD Сами векторы хранятся в сжатом виде (обычно…
- answerКак вы делаете асинхронную обработку long-running (>30s) LLM задач?
…повторная обработка]] ([[Вики/exactly-once delivery\|exactly-once семантика]]). - Хранение истории сообщений. - Распределённая обработка между микросервисами. --- ## 7. Управление очередью: приоритеты…
- answerЧто такое Memory-optimized ANN и какие алгоритмы лучшие для ограниченной RAM (<16GB)?
…Они используют: - Квантование (Quantization) — сжатие векторов до меньшего числа бит (например, 8-битное или Quantization|product quantization). - Дисковое хранение (Disk…
- answerКак устроена Memory в Harness (in-memory, fs, vector stores, relay)?
…Она включает четыре уровня: **in-memory** (быстрая, но непостоянная память текущего диалога), **filesystem (fs)** (долговременное хранение сессий), **vector stores** (поиск…
- answerКак вы управляете cost хранения векторной БД при миллиарде векторов?
…сжатие векторов (Quantization|Product Quantization), многоуровневое хранение (tiered storage), **алгоритмы для дисковых индексов** (DiskANN) и **pruning** (удаление дубликатов и нерелевантных…
- practiceТЕХНИЧЕСКОЕ ЗАДАНИЕ: Реализовать cost attribution per feature
…Определить компоненты для атрибуции - `embedding` – создание и [[Вики/retrieval\|поиск]] эмбеддингов ([[Вики/LLM endpoint\|стоимость API]] эмбеддинга + хранение) - `[[Вики/retrieval…
- answerНазовите 12+ слоёв эталонной архитектуры Harness?
…Memory & Persistence (Память и сохранение) Слой отвечает за хранение данных, выходящих за рамки одной [[Вики/session\|сессии]]. - [[Вики/In-Memory…
- practiceТЕХНИЧЕСКОЕ ЗАДАНИЕ: Настроить prompt observability
…Prometheus (pull) + `prometheus_client` (экспорт на `/metrics`) | Хранение временных рядов метрик | | Хранение логов | Loki (опционально) или файл JSONL | Детальный анализ…
- practiceТЕХНИЧЕСКОЕ ЗАДАНИЕ: Реализовать component registry
…Решение должно обеспечить централизованное хранение, [[Вики/Version control\|версионирование]] и возможность отката к предыдущим версиям компонентов без простоя системы. Ключевой…
- practiceТЕХНИЧЕСКОЕ ЗАДАНИЕ: Реализовать distributed task queue для агентов
…Технологический стек | Компонент | Инструменты | Назначение | |-----------|-------------|------------| | Брокер сообщений | Redis 7+ | Хранение очередей, обмен сообщениями, хранение результатов | | Фреймворк задач | Celery 5+ | Координация…
- practiceТЕХНИЧЕСКОЕ ЗАДАНИЕ: RAG с кэшированием ответов
…Хранение и поиск эмбеддингов | | LLM | OpenAI API / Ollama (local) | Генерация ответов | | Кэш | Redis (python redis или redis-py) | Хранение пар…
- practiceТЕХНИЧЕСКОЕ ЗАДАНИЕ: Настроить дашборд для failures
…Технологический стек | Компонент | Инструменты | Назначение | |-----------|-------------|------------| | Хранение метрик | Prometheus (pull model) или Pushgateway | Сбор и хранение временных рядов ошибок | | Визуализация | Grafana…
- practiceТЕХНИЧЕСКОЕ ЗАДАНИЕ: Настроить templating (Jinja2) для переменных {context} и {question}
…отделение логики промпта от данных, централизованное хранение шаблонов, возможность A/B‑тестирования. Ключевой результат Работающий [[Вики/Jinja2\|Jinja2]]‑[[Вики/template…
- practiceТЕХНИЧЕСКОЕ ЗАДАНИЕ: Настроить high-cardinality metrics в VictoriaMetrics
…Выполнить переход с Prometheus на [[Вики/VictoriaMetrics\|VictoriaMetrics]] (single-node или cluster), настроить сбор, хранение и визуализацию таких метрик. [[Вики…
- answerКак вы делаете асинхронную обработку long-running (>30s) LLM задач?
…нужен брокер | | [[Вики/Kafka\|Kafka]] | Высокая пропускная способность, долгое хранение сообщений, партиционирование | Сложнее настройка, не встроен scheduler | | [[Вики/Redis Streams…
- practiceТЕХНИЧЕСКОЕ ЗАДАНИЕ: Настройка мониторинга дрейфа метрик faithfulness и recall
…Технологический стек | Компонент | Инструменты | Назначение | |-----------|-------------|------------| | Язык программирования | Python 3.10+ | Скрипты расчёта, алерты, аггрегация | | Хранение метрик | PostgreSQL / SQLite / Prometheus | Долговременное…
- answerЧто такое «prompt as code» (промпты в Git, code review)?
…Ключевые принципы: - Хранение в [[Вики/Git\|Git]] — каждый [[Вики/prompt\|промпт]] — файл ([[Вики/XML\|YAML]], [[Вики/JSON\|JSON]], [[Вики/Markdown…