Поиск
- wikiDVC pipeline
# DVC pipeline ## Определение Пайплайн Data Version Control для автоматизации шагов обработки данных (например, сборка индекса) в RAG-системах. ## Где встречается…
- wikiS3 Versioning
…Что такое data version control (DVC) для RAG корпуса документов|522. Что такое data version control (DVC) для RAG корпуса…
- wikiLakeFS
…Что такое data version control (DVC) для RAG корпуса документов|522. Что такое data version control (DVC) для RAG корпуса…
- wikiData versioning
# Data versioning ## Определение Практика хранения и управления версиями наборов данных, моделей и артефактов ML, аналогично Git для кода. Использует хеши…
- wikiPachyderm
…Что такое data version control (DVC) для RAG корпуса документов|522. Что такое data version control (DVC) для RAG корпуса…
- wikiVersion control
# Version control ## Определение Управление версиями компонентов RAG-системы (документы, модели, API) для отслеживания изменений и обеспечения совместимости, например через DVC…
- wikiPre-push hook
…Что такое data version control (DVC) для RAG корпуса документов|522. Что такое data version control (DVC) для RAG корпуса…
- answerЧто такое data version control (DVC) для RAG корпуса документов?
…Что такое data version control (DVC) для RAG корпуса документов? ## Краткий тезис **control|versioning|control|control|versioning|Data control|Version…
- wikiGit LFS
…Что такое data version control (DVC) для RAG корпуса документов|522. Что такое data version control (DVC) для RAG корпуса…
- answerКак вы версионируете агента целиком (prompts, tools, memory schema, orchestration graph)?
…Git для кода и текстовых промптов, DVC (control|versioning|control|control|versioning|Data control|Version Control) для бинарных/больших схем…
- wikiGit
…Что такое data version control (DVC) для RAG корпуса документов|522. Что такое data version control (DVC) для RAG корпуса…
- answerКак вы организуете CI/CD для RAG-пайплайна?
…Использование **control|versioning|control|control|versioning|Data control|Version Control (DVC)** для документов и **blue-green deployment** позволяет безопасно обновлять…
- answerКак организовать data versioning (DVC, LakeFS, Delta Lake)?
…Что такое data version control (DVC) для RAG корпуса документов\|267]] | Как устроены data lakes и data lakehouse? | | 855 | Как…
- answerКак проектировать data contracts для RAG пайплайна?
…и [[Вики/Version control\|версионирование]]. Проектирование включает выбор формата [[Вики/template circuits\|схемы]] ([[Вики/XML\|JSON]] [[Вики/database schema\|Schema…
- wikiDVC
…Что такое «golden dataset» для агента и как его создавать|786. Что такое «golden dataset» для агента и как его…
- practiceТЕХНИЧЕСКОЕ ЗАДАНИЕ: Реализовать A/B тест для RAG
…Создать таблицу `experiment_log` для записи результатов: - `id`, `query`, `version` (control/treatment), `response`, `latency`, `rouge_l`, `timestamp`. [[Вики/Ожидаемый результат…
- answerЧто такое data version control (DVC) для RAG корпуса документов?
…Что такое data version control (DVC) для RAG корпуса документов? ## Краткий тезис **[[Вики/DVC\|Data Version Control]] ([[Вики/DVC\|DVC…
- answerКак обрабатывать late-arriving data в ingestion?
…Если более [[Вики/candidate\|новая версия]] уже есть — [[Вики/409 Conflict\|конфликт]] разрешается через [[Вики/Version control\|версионирование]] (например, MVCC…
- answerЧто такое «prompt templating» и как его версионировать?
…включает Prompt Hub с версионированием и тестированием | | **DVC (Data Version Control)** | Можно версионировать YAML-файлы промптов как любые другие данные…
- answerКак вы делаете incremental ingestion для часто меняющихся документов?
…Как вы проектируете data lineage для RAG (от документа к ответу)\|520]] - Следующий: [[522. Что такое data version control (DVC…
- answerКак вы делаете cache invalidation для semantic cache при обновлении знаний?
…простой [[Вики/TTL\|TTL]] ([[Вики/time\|Time]]‑to‑Live) может выдавать устаревшие ответы, а точное **[[Вики/Version control\|версионирование]] документов…
- answerЧто такое Prompt Registry (каталог промптов с версиями)?
…str, data: VersionCreate): version = f"1.0.0" # упрощённо; реально вычислять следующую версию ts = datetime.utcnow().isoformat() conn.execute( "INSERT…
- answerЧто такое «prompt as code» (промпты в Git, code review)?
…Цель — обеспечить [[Вики/consistency\|воспроизводимость]], [[Вики/Version control\|версионирование]], коллаборацию и [[Вики/reliability\|надёжность]] при работе с промптами, особенно в…
- answerКак вы деплоите policy (RLHF модель) в production с online feedback loop?
…Prometheus + Grafana\|Grafana]], [[Вики/Datadog\|Datadog]], [[Вики/Sentry\|Sentry]]. Дашборд должен включать - Сравнение метрик control vs experiment (reward, toxicity, latency…
- practiceТЕХНИЧЕСКОЕ ЗАДАНИЕ: Развернуть Prompt Registry
…за <50 мс (с кэшем) и корректно обрабатывает [[Вики/Version control\|версионирование]]. ## 2. Исходные данные | Что нужно | Откуда взять | |-----------|--------------| | Среда…
- answerКак вы делаете A/B тест между двумя агентами с разными архитектурами (ReAct vs Plan-and-Execute)?
…Каждый входящий [[Вики/Prompt engineering\|запрос]] пользователя направляется одновременно на [[Вики/control\|control]] и [[Вики/Treatment\|treatment]]. 2. [[Вики/control…
- answerКак вы храните историю изменений промптов (prompt lineage)?
…qa_v1.txt └── qa_v2.txt ``` Плюсы естественное [[Вики/Version control\|версионирование]], [[Вики/code review\|code review]], [[Вики/Branching\|ветвление…
- answerКак вы делаете backfill эмбеддингов при смене embedding модели?
…Что такое data version control (DVC) для RAG корпуса документов\|522]] | Тестирование RAG-системы | | [[523. Как вы делаете synthetic data…
- answerКак вы обновляете документы в существующей RAG-системе?
…Version control\|версионирование]] увеличит размер индекса в 2-3 раза. --- ## 3. Сравнение подходов | Характеристика | Full re-indexing | Incremental update | Versioned…
- answerКак вы проверяете, что новая версия модели не сломала старые кейсы?
…Дополнительные практики [[Вики/Version control\|Версионирование]] датасета тестов: - Хранить regression suite в Git LFS или DVC (Data Version Control). - Каждый…
- answerЧто такое data contract между сервисами в RAG пайплайне?
…Вики/Recency\|freshness]], [[Вики/tokens per second\|throughput]]); - [[Вики/Version control\|Версионирование]] — как обрабатываются [[Вики/Breaking changes\|breaking changes]]. В…
- answerКак вы делаете synthetic data generation для редких классов в датасете?
…Что такое data version control (DVC) для RAG корпуса документов\|267]] | Data augmentation для RAG | | [[269. Как вы обрабатываете streaming…
- answerЧто такое Harness Engineering и чем он отличается от Prompt Engineering и MLOps?
…каждая итерация промпта — новая версия. - [[Вики/Version control\|Model versioning]]: какая модель (GPT-4, Claude) использовалась. - Configuration as code: YAML…
- answerКак вы делаете synthetic data generation для редких классов в датасете?
…Что такое data version control (DVC) для RAG корпуса документов\|522]] | Как вы оцениваете качество синтетических данных? | | [[524. Как вы…
- answerКак вы делаете incremental ingestion для часто меняющихся документов?
…Как вы проектируете data lineage для RAG (от документа к ответу)\|265]] - Следующий: [[267. Что такое data version control (DVC…
- answerКак обрабатывать schema drift в данных для RAG?
…Переиндексация\|переиндексация]], [[Вики/Version control\|versioning]] документов). В контексте агентного [[Вики/гибридный поиск\|RAG]] [[Вики/database schema\|schema]] [[Вики/Position…
- answerКак управлять версиями промптов в production (best practices)?
…Поэтому [[Вики/Version control\|версионирование]] — не опция, а обязательное условие надёжности. ## 2. Git как единственный источник истины (source of truth…
- answerКак вы проектируете data lineage для RAG (от документа к ответу)?
…PII перед логированием. | | [[Вики/Version control\|Версионирование]] — документы обновляются, старые чанки становятся неактуальными | Добавить поле `version` в document_id; при…
- answerКак вы проектируете feature store для ML фичей, используемых LLM?
…Что такое data version control (DVC) для RAG корпуса документов\|522]] | Как вы деплоите LLM в production? | --- ## Навигация (Obsidian) - Предыдущий…
- practiceТЕХНИЧЕСКОЕ ЗАДАНИЕ: Настроить prompt as code
…Цель задачи Внедрить подход **[[Вики/промпт агента\|prompt]] as [[Вики/SQL\|code]]** — хранение, [[Вики/Version control\|версионирование]] и [[Вики/Prompt…
- practiceТЕХНИЧЕСКОЕ ЗАДАНИЕ: Реализовать canary analysis с авто-роллбэком для AI-сервиса
…CanaryErrorRateHigh expr: (rate(requests_total{version="canary",status="500"}[5m]) / rate(requests_total{version="canary"}[5m])) > 0.05 for: 2m…
- answerКак работает diffusion backends для генерации изображений в AI-агентах?
…data = response.json() if data.get("safety_check") == "failed": return "Извините, генерация заблокирована." return data["image_url"] else: return f…
- wikibaseline
…Написать runbook для synthetic data collapse|95. Написать runbook для synthetic data collapse]] - [[99. Написать postmortem для cache stampede|99…
- wikiИндекс терминов
…data transfers|data transfers]] - [[Вики/data types|data types]] - [[Вики/data validation|data validation]] - [[Вики/Data versioning|Data versioning]] - [[Вики…
- answerКак вы проектируете API для внешних систем, использующих вашу LLM?
…Ключевые решения включают выбор протокола (REST/gRPC), обязательную поддержку стриминга (SSE/WebSocket) для улучшения пользовательского опыта, [[Вики/Version control\|версионирование…
- answerЧто такое Semantic Caching и как вы его реализуете?
…4. [[Вики/Policy\|Политика]] кэширования – когда сохранять ответы (по умолчанию все), как инвалидировать ([[Вики/TTL\|TTL]], [[Вики/Version control\|версионирование…
- answerКак вы проектируете data lineage для RAG (от документа к ответу)?
…UUID]]. - [[Вики/Version control\|Версионирование]]: при обновлении документа создавайте новую версию, чанки с новыми id. В [[Вики/data lineage\|lineage…
- answerКак организовать feature store для AI (Feast, Hopsworks)?
…Вики/Faiss\|PostgreSQL]], [[Вики/DynamoDB\|DynamoDB]], Firestore) stores. - [[Вики/Version control\|Версионирование]] признаков через [[Вики/feature\|feature]] [[Вики/View\|views…
- answerКак вы проверяете качество parsing документов (PDF, DOCX) в production?
…Что такое data version control (DVC) для RAG корпуса документов|267(267_вопрос) | Pipeline предобработки данных для RAG | | [Вопрос [[270…
- answerКак проектировать schema registry для метаданных RAG?
…Проектирование включает выбор формата сериализации ([[Вики/Avro\|Avro]], [[Вики/JSON\|JSON]] [[Вики/database schema\|Schema]], [[Вики/Protobuf\|Protobuf]]), определение обязательных…