Поиск
- wikiincremental ingestion
# incremental ingestion ## Определение Процесс обновления поискового индекса (векторной БД) только для изменившихся документов, без полной переиндексации всего корпуса. ## Где встречается…
- wikiingestion
# ingestion ## Определение Ingestion (инжест, загрузка данных) — первый этап RAG пайплайна, включающий загрузку и парсинг документов различных форматов (PDF, Word, HTML…
- wikiingestion pipeline
# ingestion pipeline ## Определение Ingestion pipeline (пайплайн инжеста) — конвейер для приёма, обработки и индексации документов в RAG-системе, требующий гарантий доставки…
- wikiingestion_error_rate
…Как вы обрабатываете corrupted или empty документы в ingestion пайплайне|273. Как вы обрабатываете corrupted или empty документы в ingestion…
- wikiStreaming Ingestion
# Streaming Ingestion ## Определение Процесс непрерывного приёма данных из систем очередей (Kafka, Kinesis) для обновления фичей и индексов в реальном времени…
- wikiBatch ingestion
# Batch ingestion ## Определение Периодическая загрузка данных (векторов, документов) большими батчами, обычно полный пересчёт всех документов, в отличие от инкрементальной загрузки…
- wikiIngestion service
# Ingestion service ## Определение Микросервис, выполняющий парсинг, чанкование и эмбеддинг документов из очереди (например, Kafka) для загрузки в векторное хранилище. ## Где…
- wikiingestion consumer
# ingestion consumer ## Определение Ingestion consumer — компонент в архитектуре streaming RAG, который читает данные из брокера сообщений (например, Kafka) и выполняет…
- wikiqdrant-client
…Как вы делаете incremental ingestion для часто меняющихся документов|266. Как вы делаете incremental ingestion для часто меняющихся документов]] - [[521…
- wikiпайплайн
…Как вы обрабатываете corrupted или empty документы в ingestion пайплайне|273. Как вы обрабатываете corrupted или empty документы в ingestion…
- wikiApache Flink
…Как вы делаете incremental ingestion для часто меняющихся документов|521. Как вы делаете incremental ingestion для часто меняющихся документов]] - [[524…
- wikiPre-ingestion checks
# Pre-ingestion checks ## Определение Pre-ingestion checks — проверки, выполняемые перед добавлением документов в корпус RAG, чтобы обеспечить качество данных. Включают…
- wikiDebezium
…Как вы делаете incremental ingestion для часто меняющихся документов|266. Как вы делаете incremental ingestion для часто меняющихся документов]] - [[389…
- wikiIngestion latency
# Ingestion latency ## Определение Ingestion latency (задержка индексации) — метрика, измеряющая время от загрузки файла до его появления в векторной базе данных…
- wikiProducer
…Настроить backpressure в ingestion|196. Настроить backpressure в ingestion]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00. Индекс разборов|Индекс разборов…
- wikiKafka Connect
…Широко применяется для потоковой передачи изменений (CDC) и организации пайплайнов ingestion. ## Где встречается - [[266. Как вы делаете incremental ingestion для…
- wikiReal-time ingestion
# Real-time ingestion ## Определение Непрерывный приём и обработка данных по мере поступления с минимальной задержкой (менее 5 секунд до векторной…
- wikiignore strategy
…Как вы обрабатываете corrupted или empty документы в ingestion пайплайне|273. Как вы обрабатываете corrupted или empty документы в ingestion…
- wikiAWS DMS
…Как вы делаете incremental ingestion для часто меняющихся документов|266. Как вы делаете incremental ingestion для часто меняющихся документов]] - [[521…
- wikilate-arriving data
…Как строить streaming RAG pipeline (real-time ingestion)|851. Как строить streaming RAG pipeline (real-time ingestion)]] - [[864. Как обрабатывать…
- wikiConsumer group
…Как вы проектируете Kafka топологии для RAG ingestion|428. Как вы проектируете Kafka топологии для RAG ingestion]] - [[521. Как вы…
- wikiDead Letter Queue
…Как вы обрабатываете corrupted или empty документы в ingestion пайплайне|273. Как вы обрабатываете corrupted или empty документы в ingestion…
- answerКак вы обрабатываете corrupted или empty документы в ingestion пайплайне?
…Пример метрики [[Вики/Grafana\|Prometheus]]: ```python from prometheus_client import Counter, Histogram INGESTION_FAILURES = Counter('ingestion_failures_total', 'Total ingestion…
- wikiPost-ingestion checks
# Post-ingestion checks ## Определение Периодические проверки всего корпуса на деградацию качества после индексации данных. ## Где встречается - [[275. Как вы делаете…
- wikiDynamic Task Mapping
…Как проектировать Airflow DAG для RAG ingestion|863. Как проектировать Airflow DAG для RAG ingestion]] ## Навигация - [[00. Индекс терминов|Индекс…
- wikiKafdrop
…Полезен для отладки пайплайнов ingestion. ## Где встречается - [[273. Как вы обрабатываете corrupted или empty документы в ingestion пайплайне|273. Как…
- wikiMin.insync.replicas
…Используется для обеспечения отказоустойчивости в RAG ingestion. ## Где встречается - [[428. Как вы проектируете Kafka топологии для RAG ingestion|428. Как…
- wikiFlink Kubernetes Operator
…Как строить streaming RAG pipeline (real-time ingestion)|851. Как строить streaming RAG pipeline (real-time ingestion)]] ## Навигация - [[00. Индекс…
- wikiCorrupted document
# Corrupted document ## Определение Файл, не соответствующий ожидаемой структуре (сломанная кодировка, невалидный JSON/PDF), требующий обработки ошибок в ingestion пайплайне. ## Где…
- wikiConsumer
…Как вы делаете incremental ingestion для часто меняющихся документов|266. Как вы делаете incremental ingestion для часто меняющихся документов]] - [[811…
- wikiwindow + watermark
…Применяется в потоковой обработке (ingestion). ## Где встречается - [[864. Как обрабатывать late-arriving data в ingestion|864. Как обрабатывать late-arriving…
- wikiwatermark
…Как строить streaming RAG pipeline (real-time ingestion)|851. Как строить streaming RAG pipeline (real-time ingestion)]] - [[864. Как обрабатывать…
- wikiKafka Streams
…Как вы проектируете Kafka топологии для RAG ingestion|428. Как вы проектируете Kafka топологии для RAG ingestion]] - [[851. Как строить…
- wikiUPSERT
…Как вы проектируете Kafka топологии для RAG ingestion|428. Как вы проектируете Kafka топологии для RAG ingestion]] - [[823. Как проектировать…
- wikiPartitioning
…Как вы проектируете Kafka топологии для RAG ingestion|428. Как вы проектируете Kafka топологии для RAG ingestion]] - [[521. Как вы…
- wikiMinIO
…Как вы обрабатываете corrupted или empty документы в ingestion пайплайне|273. Как вы обрабатываете corrupted или empty документы в ingestion…
- wikiconfluent-kafka
…Как строить streaming RAG pipeline (real-time ingestion)|851. Как строить streaming RAG pipeline (real-time ingestion)]] - [[864. Как обрабатывать…
- wikiLocalExecutor
…Как проектировать Airflow DAG для RAG ingestion|863. Как проектировать Airflow DAG для RAG ingestion]] ## Навигация - [[00. Индекс терминов|Индекс…
- answerКак вы обрабатываете corrupted или empty документы в ingestion пайплайне?
…rate(ingestion_errors_total[5m]) / rate(ingestion_attempts_total[5m]) > 0.01 for: 2m labels: severity: critical annotations: summary: "Ingestion…
- wikiProcessing time
…Как обрабатывать late-arriving data в ingestion|864. Как обрабатывать late-arriving data в ingestion]] ## Навигация - [[00. Индекс терминов|Индекс…
- wikischedule_interval
…Как проектировать Airflow DAG для RAG ingestion|863. Как проектировать Airflow DAG для RAG ingestion]] ## Навигация - [[00. Индекс терминов|Индекс…
- wikiasyncio.Semaphore
…Настроить backpressure в ingestion|196. Настроить backpressure в ingestion]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00. Индекс разборов|Индекс разборов…
- wikion_failure_callback
…Как проектировать Airflow DAG для RAG ingestion|863. Как проектировать Airflow DAG для RAG ingestion]] ## Навигация - [[00. Индекс терминов|Индекс…
- wikiOperator
…Как проектировать Airflow DAG для RAG ingestion|863. Как проектировать Airflow DAG для RAG ingestion]] ## Навигация - [[00. Индекс терминов|Индекс…
- wikipdfplumber
…Как вы обрабатываете corrupted или empty документы в ingestion пайплайне|273. Как вы обрабатываете corrupted или empty документы в ingestion…
- wikiStrimzi
…Как строить streaming RAG pipeline (real-time ingestion)|851. Как строить streaming RAG pipeline (real-time ingestion)]] ## Навигация - [[00. Индекс…
- wikiDagster
…Как проектировать Airflow DAG для RAG ingestion|863. Как проектировать Airflow DAG для RAG ingestion]] ## Навигация - [[00. Индекс терминов|Индекс…
- wikiDelta
…Как вы делаете incremental ingestion для часто меняющихся документов|266. Как вы делаете incremental ingestion для часто меняющихся документов]] ## Навигация…
- wikiSparkSubmitOperator
…Как проектировать Airflow DAG для RAG ingestion|863. Как проектировать Airflow DAG для RAG ingestion]] ## Навигация - [[00. Индекс терминов|Индекс…
- wikiTaskGroup
…Как проектировать Airflow DAG для RAG ingestion|863. Как проектировать Airflow DAG для RAG ingestion]] ## Навигация - [[00. Индекс терминов|Индекс…