Поиск

  • wikiKafka topic

    # Kafka topic ## Определение Основная единица хранения сообщений в Kafka, разделённая на партиции; для логов LLM часто настраивается с политикой compact…

  • wikiKafka compaction

    # Kafka compaction ## Определение Механизм Kafka, при котором для каждого ключа сохраняется только последнее сообщение, удаляя старые дубликаты. Используется для эффективного…

  • wikiKafka Log Cleaner Manager

    # Kafka Log Cleaner Manager ## Определение Внутренний компонент Kafka, отвечающий за выполнение compaction; его падение может забить диск. ## Где встречается - [[252…

  • wikiconfluent_kafka

    # confluent_kafka ## Определение Python-клиент для работы с Kafka в пет-проекте реализации DLQ. ## Где встречается - [[273. Как вы обрабатываете…

  • wikiconfluent-kafka

    # confluent-kafka ## Определение Python-клиент для Kafka, используемый в пет-проекте. ## Где встречается - [[532. Что такое data contract между сервисами…

  • answerЧто такое Kafka compaction для логов LLM взаимодействий?

    Kafka topic и log compaction [[Вики/Kafka\|Kafka]] — распределённая платформа для потоковой передачи событий. Основной единицей хранения является [[Вики/Kafka

  • wikiKafka transactions

    # Kafka transactions ## Определение Механизм атомарной записи и чтения сообщений между продюсером и консюмером в одной транзакции, обеспечивающий exactly-once семантику…

  • answerПочему Kafka лучше RabbitMQ для event streaming?

    …Почему Kafka лучше RabbitMQ для event streaming? ## Краткий тезис [[Вики/Kafka\|Kafka]] превосходит [[Вики/RabbitMQ\|RabbitMQ]] в сценариях [[Вики/Event…

  • practiceТЕХНИЧЕСКОЕ ЗАДАНИЕ: RAG с incremental update (CDC из PostgreSQL → Kafka → Qdrant)

    …2. [[Вики/Kafka\|Kafka]] Поднять [[Вики/Kafka\|Kafka]] и [[Вики/ZooKeeper\|Zookeeper]] через `[[Вики/Docker\|docker-compose.yml]]` (стандартная конфигурация…

  • answerЧто такое Kafka compaction для логов LLM взаимодействий?

    …Что такое Kafka compaction для логов LLM взаимодействий? ## Краткий тезис Kafka compaction — это механизм очистки логов в Apache Kafka, который…

  • wikiKafka Connect

    # Kafka Connect ## Определение Фреймворк для интеграции Kafka с внешними источниками данных (базы данных, S3 и др.) через коннекторы. Широко применяется…

  • wikiKafka Streams

    # Kafka Streams ## Определение Библиотека для обработки потоков данных в Kafka, позволяющая выполнять дедупликацию, фильтрацию, обогащение событий и интеграцию со schema…

  • practiceТЕХНИЧЕСКОЕ ЗАДАНИЕ: Настроить distributed DLQ для failed инференса

    …2181 kafka: image: confluentinc/cp-kafka:latest depends_on: [zookeeper] ports: - 9092:9092 environment: KAFKA_BROKER_ID: 1 KAFKA_ZOOKEEPER…

  • wikiKafka Lag Exporter

    # Kafka Lag Exporter ## Определение инструмент для экспорта lag метрик Kafka в Prometheus ## Где встречается - [[407. Как вы проектируете dead letter…

  • wikiKafka lag

    # Kafka lag ## Определение Количество необработанных сообщений в топике; мониторится для обнаружения задержек в обработке. ## Где встречается - [[82. Как бы вы…

  • wikilog.cleanup.policy=compact

    # log.cleanup.policy=compact ## Определение Политика очистки топиков Kafka, при которой хранится только последнее сообщение для каждого ключа; используется для…

  • wikiKafka Headers

    # Kafka Headers ## Определение Метаданные сообщений Kafka, хранящиеся в виде пар ключ-значение. Используются для переноса служебной информации, например retry_count…

  • answerЧто такое «message bus» для агентов (Kafka, NATS, Redis PubSub)?

    …Интеграция с Python Пример отправки сообщения через [[Вики/Kafka\|Kafka]] с помощью `[[Вики/confluent-kafka\|confluent-kafka]]`: ```python from confluent…

  • wikiPartition

    # Partition ## Определение Единица параллелизма в Kafka, гарантирующая порядок сообщений внутри себя и обеспечивающая масштабирование обработки запросов. ## Где встречается - [[407. Как…

  • wikikafka-python

    # kafka-python ## Определение Python-клиент для Kafka, используемый для взаимодействия агентов с брокером сообщений. ## Где встречается - [[266. Как вы делаете…

  • answerКак бы вы спроектировали систему для реального времени (real-time) обработки документов?

    …chunks.ready) → Embedding Service → Kafka (topic: embeddings.ready) → Indexer Service → Vector DB ``` Термин [[Вики/Kafka\|Kafka]] ([[Вики/Kafka\|Apache Kafka

  • answerКак вы обрабатываете real-time фичи для LLM (например, текущий сток товара)?

    …Внешняя система (например, сервис заказов) публикует событие `stock_changed` в [[Вики/Kafka topic\|топик]] [[Вики/Kafka\|Kafka]]. 2. [[Вики/Consumer…

  • wikiAt-most-once

    …Что такое «message bus» для агентов (Kafka, NATS, Redis PubSub)|811. Что такое «message bus» для агентов (Kafka, NATS, Redis…

  • answerКак вы проектируете dead letter queue для failed LLM инференс запросов?

    …Архитектура на Kafka с несколькими retry-топиками Предлагается следующая [[Вики/database schema\|схема]] на базе [[Вики/Kafka\|Apache Kafka]] (или…

  • answerИнициализация транзакционного продюсера

    …Инструменты - [[Вики/Kafka\|Kafka]] (например, localhost:9092 через docker-compose) - Confluent Kafka Python (или `kafka-python`) - [[Вики/Redis Cluster\|Redis…

  • wikiReplacingMergeTree

    # ReplacingMergeTree ## Определение Движок таблиц ClickHouse, позволяющий эффективно хранить последние записи по ключу, альтернатива Kafka compaction для дедупликации логов. ## Где встречается…

  • answerКак строить streaming RAG pipeline (real-time ingestion)?

    …События публикуются в [[Вики/Kafka topic\|топик]] [[Вики/Kafka\|Kafka]] вида `server.[[Вики/cognitive schema\|schema]].[[Вики/Table\|table]]`. Пример…

  • answerКак вы проектируете ETL пайплайн для 1M документов/день в RAG систему?

    …сравнение | Компонент | Варианты | Плюсы | Минусы | |-----------|----------|-------|--------| | Брокер сообщений | Kafka, RabbitMQ, AWS SQS | Kafka: высокая пропускная способность, replay | Kafka: сложнее в настройке…

  • wikitransactional.id

    # transactional.id ## Определение Уникальный идентификатор транзакционного продюсера в Kafka, позволяющий восстановить состояние после сбоя. ## Где встречается - [[860. Как обеспечивать exactly…

  • wikiKRaft

    # KRaft ## Определение Протокол консенсуса для Apache Kafka, заменяющий ZooKeeper и обеспечивающий управление метаданными без внешней зависимости. ## Где встречается - [[811. Что…

  • wikiLog Cleaner

    # Log Cleaner ## Определение Фоновый процесс, который периодически сканирует топики и удаляет старые версии сообщений с одинаковым ключом (Kafka compaction). ## Где…

  • wikiTLS/SASL

    # TLS/SASL ## Определение Комбинация протоколов TLS (шифрование) и SASL (аутентификация), используемая для безопасной передачи данных в системах вроде Kafka. ## Где…

  • wikiZooKeeper

    # ZooKeeper ## Определение Сервис координации для распределённых систем, необходимый для управления кластером Kafka. Обеспечивает хранение состояния и синхронизацию компонентов. ## Где встречается…

  • wikiТранзакционный консюмер

    # Транзакционный консюмер ## Определение Консюмер в Kafka, участвующий в транзакциях для обеспечения атомарного чтения и записи, гарантируя exactly-once семантику. ## Где…

  • wikiMin.insync.replicas

    # Min.insync.replicas ## Определение Параметр конфигурации Kafka, задающий минимальное количество синхронизированных реплик для подтверждения записи. Используется для обеспечения отказоустойчивости в…

  • wiki__transaction_state

    # __transaction_state ## Определение Внутренняя тема Kafka для хранения состояния транзакций, обеспечивающая exactly-once семантику и влияющая на нагрузку кластера. ## Где…

  • wikiТранзакционный продюсер

    # Транзакционный продюсер ## Определение Продюсер в Kafka, использующий транзакции для атомарной записи сообщений в несколько партиций с гарантией exactly-once семантики…

  • wikicommit_transaction

    # commit_transaction ## Определение Операция фиксации транзакции в Kafka, которая атомарно делает запись видимой для потребителей, гарантируя целостность при exactly-once…

  • wikiJMX/MBeans

    # JMX/MBeans ## Определение Java-технология для мониторинга и управления приложениями; MBeans предоставляют метрики (например, время компактизации Kafka) и операции для…

  • wikiKey-value model

    # Key-value model ## Определение Модель данных для Kafka compaction: ключ — идентификатор сессии, значение — полная история диалога, что позволяет хранить последнее…

  • practiceТЕХНИЧЕСКОЕ ЗАДАНИЕ: Реализовать compaction в векторной БД

    …Цель задачи Разработать и внедрить механизм [[Вики/Kafka compaction\|compaction]] (слияния маленьких сегментов) для векторной базы данных на основе [[Вики…

  • wikiCommit log

    # Commit log ## Определение Структура данных, лежащая в основе Kafka: каждый топик представляет собой журнал подтверждений (commit log), в который записываются…

  • wikiisolation.level=read_committed

    # isolation.level=read_committed ## Определение Уровень изоляции консюмера Kafka, гарантирующий чтение только закоммиченных транзакций, обеспечивая консистентность данных. ## Где встречается - [[860…

  • wikiConsumer

    # Consumer ## Определение Компонент, который читает сообщения из очереди (например, Kafka) и обрабатывает их для парсинга, индексации или retrieval. ## Где встречается…

  • answerКак вы проектируете ETL пайплайн для 1M документов/день в RAG систему?

    …CSV/JSON экспорты по расписанию — через [[Вики/Airflow\|Airflow]] загружаем в [[Вики/Kafka\|Kafka]]. Почему [[Вики/Kafka\|Kafka]] - [[Вики/buffer…

  • wikiACL

    …Как вы проектируете Kafka топологии для RAG ingestion|428. Как вы проектируете Kafka топологии для RAG ingestion]] - [[800+ вопросов|800…

  • practiceТЕХНИЧЕСКОЕ ЗАДАНИЕ: Настроить exactly-once delivery

    …2181 kafka: image: confluentinc/cp-kafka:7.5.0 ports: - "9092:9092" environment: KAFKA_ZOOKEEPER_CONNECT: zookeeper:2181 KAFKA_ADVERTISED…

  • answerКак проектировать CDC (Change Data Capture) для документов?

    …Инструменты - Docker Compose (PostgreSQL + Debezium + Kafka + Kafka Connect). - Python (fastapi для REST, kafka-python для consumer, chromadb для векторного хранилища…

  • wikiacks=all

    # acks=all ## Определение Настройка Kafka producer, требующая подтверждения записи от всех in-sync реплик. Обеспечивает максимальную надежность доставки. ## Где встречается…

  • answerКак вы проектируете dead letter queue для failed LLM инференс запросов?

    …Реализация задержки: - В [[Вики/Kafka\|Kafka]] нет встроенной задержки, поэтому используют [[Вики/Kafka Streams\|Kafka Streams]] или отдельный [[Вики/exponential…