Поиск

  • wikiOperator

    # Operator ## Определение Шаблон задачи в Apache Airflow, например PythonOperator или SparkSubmitOperator, определяющий выполняемое действие. ## Где встречается - [[863. Как проектировать Airflow

  • wikiPool

    # Pool ## Определение Механизм Airflow для ограничения параллельного выполнения задач, например, для GPU-задач, чтобы избежать перегрузки ресурсов. ## Где встречается - [[863…

  • wikiSensor

    # Sensor ## Определение Тип оператора Apache Airflow, который ожидает наступления условия (например, появления файла в S3) перед запуском последующих задач. ## Где…

  • wikiVariable

    # Variable ## Определение Механизм Apache Airflow для хранения пар ключ-значение, используемый для конфигураций, чекпоинтов и общих данных между задачами. ## Где…

  • wikiLocalExecutor

    # LocalExecutor ## Определение LocalExecutor — исполнитель Airflow для локального выполнения задач, используемый в пет-проектах. ## Где встречается - [[863. Как проектировать Airflow DAG…

  • wikischedule_interval

    # schedule_interval ## Определение Параметр DAG в Apache Airflow, задающий частоту запуска (например, '@hourly'). ## Где встречается - [[863. Как проектировать Airflow DAG…

  • wikion_failure_callback

    # on_failure_callback ## Определение Коллбэк Airflow при падении DAG для отправки уведомлений. ## Где встречается - [[863. Как проектировать Airflow DAG для…

  • wikiDagster

    # Dagster ## Определение Платформа оркестрации данных, альтернатива Airflow, с упором на декларативное определение data assets и автоматическое управление зависимостями. ## Где встречается…

  • wikiSparkSubmitOperator

    # SparkSubmitOperator ## Определение Оператор Airflow для отправки Spark-приложения на кластер, используемый для параллельной обработки файлов в DAG инжекции. ## Где встречается…

  • wikiTaskGroup

    # TaskGroup ## Определение Конструкция в Airflow для логической группировки задач, позволяющая организовать параллельное выполнение и управление зависимостями внутри DAG. ## Где встречается…

  • wikiXCom

    # XCom ## Определение Механизм Apache Airflow для обмена небольшими объёмами данных между задачами внутри DAG'а. Используется для передачи метаданных или…

  • wikiDynamic Task Mapping

    # Dynamic Task Mapping ## Определение Механизм в Airflow, позволяющий создавать задачи динамически на основе данных, например, для параллельной обработки документов в…

  • wikiTask

    …Как проектировать Airflow DAG для RAG ingestion|863. Как проектировать Airflow DAG для RAG ingestion]] - [[292. Реализовать distributed task queue…

  • wikiAirflow

    # Airflow ## Определение Платформа для оркестрации рабочих процессов, мониторинга и повторных попыток выполнения DAG, часто используется для batch-пайплайнов и ETL…

  • wikirun_id

    …Как проектировать Airflow DAG для RAG ingestion|863. Как проектировать Airflow DAG для RAG ingestion]] ## Навигация - [[00. Индекс терминов|Индекс…

  • wikiKubeflow Pipelines

    …Как проектировать Airflow DAG для RAG ingestion|863. Как проектировать Airflow DAG для RAG ingestion]] ## Навигация - [[00. Индекс терминов|Индекс…

  • wikiretry_delay

    …Как проектировать Airflow DAG для RAG ingestion|863. Как проектировать Airflow DAG для RAG ingestion]] ## Навигация - [[00. Индекс терминов|Индекс…

  • wikiS3 timeout

    …Как проектировать Airflow DAG для RAG ingestion|863. Как проектировать Airflow DAG для RAG ingestion]] ## Навигация - [[00. Индекс терминов|Индекс…

  • answerКак проектировать Airflow DAG для RAG ingestion?

    …Альтернативы Airflow и их сравнение | Инструмент | Плюсы для RAG ingestion | Минусы | |------------|-------------------------|--------| | [[Вики/Airflow\|Airflow]] | Зрелый, широко распространён, много интеграций (Spark…

  • wikiSemanticChunker

    …Как проектировать Airflow DAG для RAG ingestion|863. Как проектировать Airflow DAG для RAG ingestion]] ## Навигация - [[00. Индекс терминов|Индекс…

  • wikiAgentic chunking

    …Как проектировать Airflow DAG для RAG ingestion|863. Как проектировать Airflow DAG для RAG ingestion]] ## Навигация - [[00. Индекс терминов|Индекс…

  • wikiPrefect

    # Prefect ## Определение Платформа для оркестрации DAG-пайплайнов, альтернатива Airflow, ориентированная на long-running задач и мониторинг. Часто применяется для управления…

  • wikiFixed-size chunking

    …Как проектировать Airflow DAG для RAG ingestion|863. Как проектировать Airflow DAG для RAG ingestion]] - [[800+ вопросов|800+ вопросов]] ## Навигация…

  • answerКак вы проектируете ETL пайплайн для 1M документов/день в RAG систему?

    …Пример DAG (псевдокод): ```python from airflow import DAG from airflow.providers.apache.kafka.operators.kafka_consume import ConsumeFromTopicOperator from airflow

  • wikiincremental ingestion

    …Как проектировать Airflow DAG для RAG ingestion|863. Как проектировать Airflow DAG для RAG ingestion]] - [[800+ вопросов|800+ вопросов]] ## Навигация…

  • answerКакие инструменты для Delegation Engineering существуют (Airflow для агентов)?

    …рабочие движки ([[Вики/Temporal\|Temporal]], [[Вики/Camunda\|Camunda]]), DAG-оркестраторы ([[Вики/Airflow\|Airflow]], [[Вики/Prefect\|Prefect]]), облачные функции ([[Вики/step…

  • wikiDAG orchestration

    …Как проектировать Airflow DAG для RAG ingestion|863. Как проектировать Airflow DAG для RAG ingestion]] - [[Практика|Практика]] - [[800+ вопросов|800…

  • answerКак вы проектируете ETL пайплайн для 1M документов/день в RAG систему?

    Airflow [[Вики/Airflow\|Apache Airflow]] — платформа для оркестрации рабочих процессов. Используется для: - Мониторинга здоровья consumer'ов (если consumer упал — Airflow

  • answerКак проектировать ETL vs ELT для RAG?

    …не нужно разворачивать [[Вики/cluster\|кластер]] [[Вики/Spark\|Spark]], достаточно одного Python-скрипта на [[Вики/Airflow\|Airflow]]. --- ## 4. Когда ELT…

  • wikiingestion

    …Как проектировать Airflow DAG для RAG ingestion|863. Как проектировать Airflow DAG для RAG ingestion]] - [[865. Как проектировать schema registry…

  • wikibulk insert

    …Как проектировать Airflow DAG для RAG ingestion|863. Как проектировать Airflow DAG для RAG ingestion]] - [[800+ вопросов|800+ вопросов]] - [[253…

  • wikiSpark

    …Как проектировать Airflow DAG для RAG ingestion|863. Как проектировать Airflow DAG для RAG ingestion]] - [[800+ вопросов|800+ вопросов]] ## Навигация…

  • wikicompute-communication overlap

    …Как проектировать Airflow DAG для RAG ingestion|863. Как проектировать Airflow DAG для RAG ingestion]] - [[Практика|Практика]] - [[800+ вопросов|800…

  • wikiETL

    …Как проектировать Airflow DAG для RAG ingestion|863. Как проектировать Airflow DAG для RAG ingestion]] - [[800+ вопросов|800+ вопросов]] ## Навигация…

  • wikiPersistence

    …Как проектировать Airflow DAG для RAG ingestion|863. Как проектировать Airflow DAG для RAG ingestion]] - [[Практика|Практика]] - [[800+ вопросов|800…

  • wikiMinIO

    …Как проектировать Airflow DAG для RAG ingestion|863. Как проектировать Airflow DAG для RAG ingestion]] - [[15. Настроить tiered storage (hotwarmcold…

  • wikiSemantic chunking

    …Как проектировать Airflow DAG для RAG ingestion|863. Как проектировать Airflow DAG для RAG ingestion]] - [[Практика|Практика]] - [[800+ вопросов|800…

  • answerКак вы делаете data quality monitoring для RAG корпуса?

    …Пример с [[Вики/Airflow\|Airflow]]: ```python from airflow import DAG from airflow.operators.python import PythonOperator def validate_new_docs…

  • wikiUPSERT

    …Как проектировать Airflow DAG для RAG ingestion|863. Как проектировать Airflow DAG для RAG ingestion]] - [[86. Реализовать user feedback loop…

  • wikipdfplumber

    …Как проектировать Airflow DAG для RAG ingestion|863. Как проектировать Airflow DAG для RAG ingestion]] - [[266. Сгенерировать synthetic датасет для…

  • wikiRecursiveCharacterTextSplitter

    …Как проектировать Airflow DAG для RAG ingestion|863. Как проектировать Airflow DAG для RAG ingestion]] - [[800+ вопросов|800+ вопросов]] - [[50…

  • wikiDead Letter Queue

    …Как проектировать Airflow DAG для RAG ingestion|863. Как проектировать Airflow DAG для RAG ingestion]] - [[Практика|Практика]] - [[800+ вопросов|800…

  • wikiOOM

    …Как проектировать Airflow DAG для RAG ingestion|863. Как проектировать Airflow DAG для RAG ingestion]] - [[800+ вопросов|800+ вопросов]] - [[51…

  • wikiSLA

    …Как проектировать Airflow DAG для RAG ingestion|863. Как проектировать Airflow DAG для RAG ingestion]] - [[864. Как обрабатывать late-arriving…

  • wikitext-embedding-3-small

    …Как проектировать Airflow DAG для RAG ingestion|863. Как проектировать Airflow DAG для RAG ingestion]] - [[800+ вопросов|800+ вопросов]] - [[225…

  • wikiPrometheus + Grafana

    …Как проектировать Airflow DAG для RAG ingestion|863. Как проектировать Airflow DAG для RAG ingestion]] - [[886. Как делать sandboxing для…

  • wikiidempotency key

    …Как проектировать Airflow DAG для RAG ingestion|863. Как проектировать Airflow DAG для RAG ingestion]] - [[800+ вопросов|800+ вопросов]] - [[14…

  • answerКак вы оцениваете faithfulness RAG-ответа в production автоматически?

    …Пример конфигурации Airflow DAG ```python from airflow import DAG from airflow.operators.python import PythonOperator from datetime import datetime, timedelta…

  • answerКак вы проектируете data lineage для RAG (от документа к ответу)?

    …на [[Вики/SQL\|Python]], Java, [[Вики/Spark\|Spark]], [[Вики/Airflow\|Airflow]] и др. Пример события для этапа [[Вики/retrieval\|retrieval…

  • wikiexponential backoff

    …Как проектировать Airflow DAG для RAG ingestion|863. Как проектировать Airflow DAG для RAG ingestion]] - [[896. Как сделать агента самовосстанавливающимся…