Поиск

  • wikipipeline bubbles

    # pipeline bubbles ## Определение Время простоя GPU при ожидании результатов от предыдущего этапа конвейера, характерное для pipeline parallelism. ## Где встречается - [[203…

  • wiki1F1B

    # 1F1B ## Определение Схема pipeline parallelism с чередованием forward и backward одного микробатча, уменьшающая пузыри и потребление памяти. ## Где встречается - [[203…

  • wikimicrobatches

    # microbatches ## Определение Разбиение батча на мелкие части для конвейерной обработки, уменьшающее простои (bubbles) в pipeline parallelism. ## Где встречается - [[203. Tensor…

  • wikiPipeline bubble ratio

    …Что такое pipeline parallelism и проблема pipeline bubbles|424. Что такое pipeline parallelism и проблема pipeline bubbles]] ## Навигация - [[00. Индекс…

  • wikiAgent Pipeline

    # Agent Pipeline ## Определение Полный путь выполнения запроса через вызовы LLM, инструменты, внутренние переходы между агентами и циклы рефлексии. Включает трассировку…

  • wikiRedis pipeline

    # Redis pipeline ## Определение Техника групповой отправки команд Redis без ожидания ответа, уменьшающая задержки. Также термин используется для обозначения pipeline parallelism…

  • wikiingestion pipeline

    # ingestion pipeline ## Определение Ingestion pipeline (пайплайн инжеста) — конвейер для приёма, обработки и индексации документов в RAG-системе, требующий гарантий доставки…

  • wiki3D parallelism

    # 3D parallelism ## Определение Комбинация трёх уровней параллелизма (data, tensor, pipeline) для распределённого обучения больших моделей (100B+ параметров). Стандартный подход для…

  • wikiG-Pipe

    …Что такое pipeline parallelism и проблема pipeline bubbles|424. Что такое pipeline parallelism и проблема pipeline bubbles]] ## Навигация - [[00. Индекс…

  • wikiInterleaved 1F1B

    # Interleaved 1F1B ## Определение Улучшенная схема pipeline parallelism, при которой каждая стадия обрабатывает несколько последовательных фрагментов, уменьшая pipeline bubbles. ## Где встречается…

  • wikiпайплайн автоматического тестирования

    # пайплайн автоматического тестирования ## Определение CI/CD-пайплайн, автоматизирующий запуск тестов (включая регрессионные) на Golden Dataset для проверки качества агента или…

  • wikistreaming feature pipeline

    # streaming feature pipeline ## Определение Архитектурный паттерн для real-time RAG, обеспечивающий непрерывное обновление признаков из потоковых данных. ## Где встречается - [[800…

  • wikiStreaming pipeline

    # Streaming pipeline ## Определение Архитектурный паттерн, при котором все компоненты обрабатывают данные потоково для минимизации задержки. Часто используется с Kafka и…

  • wikipipeline architecture

    # pipeline architecture ## Определение Архитектурный паттерн Haystack, применяемый для построения надёжных production-пайплайнов. ## Где встречается - [[800+ вопросов|800+ вопросов]] ## Навигация - [[00…

  • wikiEmbedding Pipeline

    # Embedding Pipeline ## Определение Пайплайн, преобразующий документы в векторные представления (эмбеддинги) для последующего поиска. В production требует обработки с гарантией exactly…

  • wikiingestion

    …Как проектировать AI pipeline с at-least-once семантикой|823. Как проектировать AI pipeline с at-least-once семантикой]] - [[863…

  • wikiLLM pipeline

    # LLM pipeline ## Определение Цепочка компонентов (RAG, кэш, модель, валидация) для обработки запроса к LLM; оценка cost-effectiveness учитывает каждый этап…

  • wikimessage pipeline

    # message pipeline ## Определение Архитектурный паттерн для обработки сообщений агентов, включающий последовательность основных топиков, повторных попыток (retry) и очереди недоставленных сообщений…

  • wikiMegatron-LM

    # Megatron-LM ## Определение Megatron-LM — фреймворк от NVIDIA для распределённого обучения больших языковых моделей, реализующий 3D parallelism (data, tensor, pipeline

  • wikiModel parallelism

    # Model parallelism ## Определение Общая стратегия распараллеливания модели, включающая Tensor Parallelism и Pipeline Parallelism. ## Где встречается - [[203. Tensor parallelism vs pipeline

  • wikiHuggingFace pipeline

    # HuggingFace pipeline ## Определение Упрощённый интерфейс в библиотеке Transformers для запуска предобученных моделей на задачах NLP без написания дополнительного кода. ## Где…

  • wiki1F1B with interleaving

    # 1F1B with interleaving ## Определение Разбиение стадий pipeline на меньшие блоки для дополнительного уменьшения pipeline bubble. ## Где встречается - [[426. Что такое…

  • wikiPipeline parallelism

    # Pipeline parallelism ## Определение Стратегия распараллеливания, при которой модель разрезается по слоям между узлами (GPU); требует микробатчей и страдает от pipeline

  • wikiML pipeline

    # ML pipeline ## Определение Конвейер обработки данных и обучения/инференса моделей, в который встраивается canary analysis для безопасного развертывания. ## Где встречается…

  • wikiDVC pipeline

    # DVC pipeline ## Определение Пайплайн Data Version Control для автоматизации шагов обработки данных (например, сборка индекса) в RAG-системах. ## Где встречается…

  • answerЧто такое pipeline parallelism и проблема pipeline bubbles?

    …Что такое pipeline parallelism и проблема pipeline bubbles? ## Краткий тезис **[[Вики/пайплайн автоматического тестирования\|Pipeline]] [[Вики/parallelism\|parallelism]]** — это техника…

  • wikiself-healing pipeline

    # self-healing pipeline ## Определение Архитектура пайплайна, включающая мониторинг, оценку и автоматическое восстановление, например, переключение на fallback-схему при обнаружении дрейфа…

  • wikiHidden dimension

    …Tensor parallelism vs pipeline parallelism vs data parallelism — сравните для LLM инференса.|203. Tensor parallelism vs pipeline parallelism vs data…

  • wikiпайплайн

    # пайплайн ## Определение Автоматизированная последовательность шагов обработки данных, объединённых в единый процесс для выполнения конкретной задачи, такой как загрузка, трансформация или…

  • wikiNVLink

    …Что такое pipeline parallelism и проблема pipeline bubbles|424. Что такое pipeline parallelism и проблема pipeline bubbles]] - [[425. Как работает…

  • wikiPoint-to-point communication

    …Tensor parallelism vs pipeline parallelism vs data parallelism — сравните для LLM инференса.|203. Tensor parallelism vs pipeline parallelism vs data…

  • wikieval пайплайн

    # eval пайплайн ## Определение Конвейер автоматической оценки, запускаемый при pull request для генерации отчёта о качестве. ## Где встречается - [[Практика|Практика]] - [[800…

  • wikimulti-agent pipeline

    # multi-agent pipeline ## Определение Система делегирования задач между AI-агентами, часто реализованная на базе фреймворков вроде LangGraph или AutoGen. ## Где…

  • wikiChimera

    # Chimera ## Определение Оптимизированное расписание для pipeline parallelism, уменьшающее время простоя (bubble) за счет более гибкого распределения микро-батчей. ## Где встречается…

  • wikiColossal-AI

    # Colossal-AI ## Определение Фреймворк для распределённого обучения, предоставляющий более гибкие комбинации параллелизма (data, tensor, pipeline), чем стандартные подходы. ## Где встречается…

  • wikiKubeflow Pipelines

    # Kubeflow Pipelines ## Определение Нативный для Kubernetes фреймворк для построения и управления конвейерами машинного обучения с поддержкой пайплайнов на основе DAG…

  • wikiCI/CD for ML pipelines

    # CI/CD for ML pipelines ## Определение Непрерывная интеграция и доставка для ML-пайплайнов, включая проверку промптов. ## Где встречается - [[167. Реализовать…

  • wikiData pipeline

    # Data pipeline ## Определение Пайплайн обработки данных для RAG, включающий этапы сбора, очистки, обновления и подачи в базу знаний. ## Где встречается…

  • wikiRAG pipeline

    # RAG pipeline ## Определение RAG-пайплайн — конвейер, объединяющий этапы загрузки, индексации, поиска (retrieval) и генерации ответа (generation). Используется для автоматизации развёртывания…

  • wikiMLOps pipeline

    # MLOps pipeline ## Определение CI/CD-пайплайн для автоматизации шагов ML-процесса, таких как обучение, валидация, регистрация моделей и развёртывание. ## Где…

  • wikiPipeline flush

    # Pipeline flush ## Определение Штраф в 10–20 тактов на CPU при ошибке предсказания ветвления, приводящий к сбросу конвейера команд. ## Где…

  • wikiGPipe

    # GPipe ## Определение Фреймворк для pipeline parallelism в обучении нейросетей, который использует micro-batching для эффективного использования вычислительных ресурсов. ## Где встречается…

  • wikisequence parallelism

    …Tensor parallelism vs pipeline parallelism vs data parallelism — сравните для LLM инференса.|203. Tensor parallelism vs pipeline parallelism vs data…

  • wikiDeepSpeed Inference

    # DeepSpeed Inference ## Определение Компонент DeepSpeed для автоматического выбора tensor/pipeline parallelism на основе профилирования для ускорения инференса. ## Где встречается - [[203…

  • wikiretrieval pipeline

    # retrieval pipeline ## Определение Пайплайн, преобразующий запрос в эмбеддинг, выполняющий поиск top-k чанков и возвращающий результаты. ## Где встречается - [[81. Как…

  • wikireal-time RAG

    …Как строить streaming RAG pipeline (real-time ingestion)|851. Как строить streaming RAG pipeline (real-time ingestion)]] - [[800+ вопросов|800…

  • wikiDependency injection in LLM pipelines

    # Dependency injection in LLM pipelines ## Определение Паттерн для управления зависимостями между компонентами LLM-приложений, позволяющий гибко подключать и заменять модули…

  • wikigradient accumulation

    …Что такое pipeline parallelism и проблема pipeline bubbles|424. Что такое pipeline parallelism и проблема pipeline bubbles]] - [[426. Что такое…

  • wikiData parallelism

    …Что такое pipeline parallelism и проблема pipeline bubbles|424. Что такое pipeline parallelism и проблема pipeline bubbles]] - [[425. Как работает…

  • wikiInfiniBand

    …Что такое pipeline parallelism и проблема pipeline bubbles|424. Что такое pipeline parallelism и проблема pipeline bubbles]] - [[425. Как работает…