Поиск
- wikipipeline bubbles
# pipeline bubbles ## Определение Время простоя GPU при ожидании результатов от предыдущего этапа конвейера, характерное для pipeline parallelism. ## Где встречается - [[203…
- wiki1F1B
# 1F1B ## Определение Схема pipeline parallelism с чередованием forward и backward одного микробатча, уменьшающая пузыри и потребление памяти. ## Где встречается - [[203…
- wikimicrobatches
# microbatches ## Определение Разбиение батча на мелкие части для конвейерной обработки, уменьшающее простои (bubbles) в pipeline parallelism. ## Где встречается - [[203. Tensor…
- wikiPipeline bubble ratio
…Что такое pipeline parallelism и проблема pipeline bubbles|424. Что такое pipeline parallelism и проблема pipeline bubbles]] ## Навигация - [[00. Индекс…
- wikiAgent Pipeline
# Agent Pipeline ## Определение Полный путь выполнения запроса через вызовы LLM, инструменты, внутренние переходы между агентами и циклы рефлексии. Включает трассировку…
- wikiRedis pipeline
# Redis pipeline ## Определение Техника групповой отправки команд Redis без ожидания ответа, уменьшающая задержки. Также термин используется для обозначения pipeline parallelism…
- wikiingestion pipeline
# ingestion pipeline ## Определение Ingestion pipeline (пайплайн инжеста) — конвейер для приёма, обработки и индексации документов в RAG-системе, требующий гарантий доставки…
- wiki3D parallelism
# 3D parallelism ## Определение Комбинация трёх уровней параллелизма (data, tensor, pipeline) для распределённого обучения больших моделей (100B+ параметров). Стандартный подход для…
- wikiG-Pipe
…Что такое pipeline parallelism и проблема pipeline bubbles|424. Что такое pipeline parallelism и проблема pipeline bubbles]] ## Навигация - [[00. Индекс…
- wikiInterleaved 1F1B
# Interleaved 1F1B ## Определение Улучшенная схема pipeline parallelism, при которой каждая стадия обрабатывает несколько последовательных фрагментов, уменьшая pipeline bubbles. ## Где встречается…
- wikiпайплайн автоматического тестирования
# пайплайн автоматического тестирования ## Определение CI/CD-пайплайн, автоматизирующий запуск тестов (включая регрессионные) на Golden Dataset для проверки качества агента или…
- wikistreaming feature pipeline
# streaming feature pipeline ## Определение Архитектурный паттерн для real-time RAG, обеспечивающий непрерывное обновление признаков из потоковых данных. ## Где встречается - [[800…
- wikiStreaming pipeline
# Streaming pipeline ## Определение Архитектурный паттерн, при котором все компоненты обрабатывают данные потоково для минимизации задержки. Часто используется с Kafka и…
- wikipipeline architecture
# pipeline architecture ## Определение Архитектурный паттерн Haystack, применяемый для построения надёжных production-пайплайнов. ## Где встречается - [[800+ вопросов|800+ вопросов]] ## Навигация - [[00…
- wikiEmbedding Pipeline
# Embedding Pipeline ## Определение Пайплайн, преобразующий документы в векторные представления (эмбеддинги) для последующего поиска. В production требует обработки с гарантией exactly…
- wikiingestion
…Как проектировать AI pipeline с at-least-once семантикой|823. Как проектировать AI pipeline с at-least-once семантикой]] - [[863…
- wikiLLM pipeline
# LLM pipeline ## Определение Цепочка компонентов (RAG, кэш, модель, валидация) для обработки запроса к LLM; оценка cost-effectiveness учитывает каждый этап…
- wikimessage pipeline
# message pipeline ## Определение Архитектурный паттерн для обработки сообщений агентов, включающий последовательность основных топиков, повторных попыток (retry) и очереди недоставленных сообщений…
- wikiMegatron-LM
# Megatron-LM ## Определение Megatron-LM — фреймворк от NVIDIA для распределённого обучения больших языковых моделей, реализующий 3D parallelism (data, tensor, pipeline…
- wikiModel parallelism
# Model parallelism ## Определение Общая стратегия распараллеливания модели, включающая Tensor Parallelism и Pipeline Parallelism. ## Где встречается - [[203. Tensor parallelism vs pipeline…
- wikiHuggingFace pipeline
# HuggingFace pipeline ## Определение Упрощённый интерфейс в библиотеке Transformers для запуска предобученных моделей на задачах NLP без написания дополнительного кода. ## Где…
- wiki1F1B with interleaving
# 1F1B with interleaving ## Определение Разбиение стадий pipeline на меньшие блоки для дополнительного уменьшения pipeline bubble. ## Где встречается - [[426. Что такое…
- wikiPipeline parallelism
# Pipeline parallelism ## Определение Стратегия распараллеливания, при которой модель разрезается по слоям между узлами (GPU); требует микробатчей и страдает от pipeline…
- wikiML pipeline
# ML pipeline ## Определение Конвейер обработки данных и обучения/инференса моделей, в который встраивается canary analysis для безопасного развертывания. ## Где встречается…
- wikiDVC pipeline
# DVC pipeline ## Определение Пайплайн Data Version Control для автоматизации шагов обработки данных (например, сборка индекса) в RAG-системах. ## Где встречается…
- answerЧто такое pipeline parallelism и проблема pipeline bubbles?
…Что такое pipeline parallelism и проблема pipeline bubbles? ## Краткий тезис **[[Вики/пайплайн автоматического тестирования\|Pipeline]] [[Вики/parallelism\|parallelism]]** — это техника…
- wikiself-healing pipeline
# self-healing pipeline ## Определение Архитектура пайплайна, включающая мониторинг, оценку и автоматическое восстановление, например, переключение на fallback-схему при обнаружении дрейфа…
- wikiHidden dimension
…Tensor parallelism vs pipeline parallelism vs data parallelism — сравните для LLM инференса.|203. Tensor parallelism vs pipeline parallelism vs data…
- wikiпайплайн
# пайплайн ## Определение Автоматизированная последовательность шагов обработки данных, объединённых в единый процесс для выполнения конкретной задачи, такой как загрузка, трансформация или…
- wikiNVLink
…Что такое pipeline parallelism и проблема pipeline bubbles|424. Что такое pipeline parallelism и проблема pipeline bubbles]] - [[425. Как работает…
- wikiPoint-to-point communication
…Tensor parallelism vs pipeline parallelism vs data parallelism — сравните для LLM инференса.|203. Tensor parallelism vs pipeline parallelism vs data…
- wikieval пайплайн
# eval пайплайн ## Определение Конвейер автоматической оценки, запускаемый при pull request для генерации отчёта о качестве. ## Где встречается - [[Практика|Практика]] - [[800…
- wikimulti-agent pipeline
# multi-agent pipeline ## Определение Система делегирования задач между AI-агентами, часто реализованная на базе фреймворков вроде LangGraph или AutoGen. ## Где…
- wikiChimera
# Chimera ## Определение Оптимизированное расписание для pipeline parallelism, уменьшающее время простоя (bubble) за счет более гибкого распределения микро-батчей. ## Где встречается…
- wikiColossal-AI
# Colossal-AI ## Определение Фреймворк для распределённого обучения, предоставляющий более гибкие комбинации параллелизма (data, tensor, pipeline), чем стандартные подходы. ## Где встречается…
- wikiKubeflow Pipelines
# Kubeflow Pipelines ## Определение Нативный для Kubernetes фреймворк для построения и управления конвейерами машинного обучения с поддержкой пайплайнов на основе DAG…
- wikiCI/CD for ML pipelines
# CI/CD for ML pipelines ## Определение Непрерывная интеграция и доставка для ML-пайплайнов, включая проверку промптов. ## Где встречается - [[167. Реализовать…
- wikiData pipeline
# Data pipeline ## Определение Пайплайн обработки данных для RAG, включающий этапы сбора, очистки, обновления и подачи в базу знаний. ## Где встречается…
- wikiRAG pipeline
# RAG pipeline ## Определение RAG-пайплайн — конвейер, объединяющий этапы загрузки, индексации, поиска (retrieval) и генерации ответа (generation). Используется для автоматизации развёртывания…
- wikiMLOps pipeline
# MLOps pipeline ## Определение CI/CD-пайплайн для автоматизации шагов ML-процесса, таких как обучение, валидация, регистрация моделей и развёртывание. ## Где…
- wikiPipeline flush
# Pipeline flush ## Определение Штраф в 10–20 тактов на CPU при ошибке предсказания ветвления, приводящий к сбросу конвейера команд. ## Где…
- wikiGPipe
# GPipe ## Определение Фреймворк для pipeline parallelism в обучении нейросетей, который использует micro-batching для эффективного использования вычислительных ресурсов. ## Где встречается…
- wikisequence parallelism
…Tensor parallelism vs pipeline parallelism vs data parallelism — сравните для LLM инференса.|203. Tensor parallelism vs pipeline parallelism vs data…
- wikiDeepSpeed Inference
# DeepSpeed Inference ## Определение Компонент DeepSpeed для автоматического выбора tensor/pipeline parallelism на основе профилирования для ускорения инференса. ## Где встречается - [[203…
- wikiretrieval pipeline
# retrieval pipeline ## Определение Пайплайн, преобразующий запрос в эмбеддинг, выполняющий поиск top-k чанков и возвращающий результаты. ## Где встречается - [[81. Как…
- wikireal-time RAG
…Как строить streaming RAG pipeline (real-time ingestion)|851. Как строить streaming RAG pipeline (real-time ingestion)]] - [[800+ вопросов|800…
- wikiDependency injection in LLM pipelines
# Dependency injection in LLM pipelines ## Определение Паттерн для управления зависимостями между компонентами LLM-приложений, позволяющий гибко подключать и заменять модули…
- wikigradient accumulation
…Что такое pipeline parallelism и проблема pipeline bubbles|424. Что такое pipeline parallelism и проблема pipeline bubbles]] - [[426. Что такое…
- wikiData parallelism
…Что такое pipeline parallelism и проблема pipeline bubbles|424. Что такое pipeline parallelism и проблема pipeline bubbles]] - [[425. Как работает…
- wikiInfiniBand
…Что такое pipeline parallelism и проблема pipeline bubbles|424. Что такое pipeline parallelism и проблема pipeline bubbles]] - [[425. Как работает…