Поиск

wikiEvolutionary algorithms
# Evolutionary algorithms ## Определение Метод черного ящика для генерации adversarial example: поиск шума эволюционным путём. ## Где встречается - [[324. Что такое TVM…
wikiPC algorithm
# PC algorithm ## Определение Алгоритм обучения направленного ациклического графа (DAG) из наблюдательных данных, основанный на проверках условной независимости. Используется для выявления…
wikiGES algorithm
# GES algorithm ## Определение Алгоритм обучения направленных ациклических графов (DAG) на основе жадного поиска эквивалентности. Используется для выявления причинно-следственных связей…
wikiBully algorithm
# Bully algorithm ## Определение Алгоритм выбора лидера в распределённых системах, где агент с наибольшим идентификатором становится лидером после отправки сообщений ELECTION…
wikiRing
# Ring ## Определение Алгоритм кольцевой редукции (Ring AllReduce), используемый в NCCL для эффективной коммуникации между GPU, особенно для больших сообщений. ## Где…
wikiTree
# Tree ## Определение Древовидный алгоритм редукции (AllReduce) в NCCL, эффективный для малых сообщений. ## Где встречается - [[800+ вопросов|800+ вопросов]] - [[1. Развернуть…
wikiадаптивные алгоритмы
# адаптивные алгоритмы ## Определение Алгоритмы, динамически подстраивающие параметры compaction под текущую нагрузку для оптимизации производительности хранилища. ## Где встречается - [[16. Реализовать compaction…
wikialgbw
# algbw ## Определение Алгоритмическая пропускная способность, измеряемая в бенчмарках (например, all_reduce_perf), включающая накладные расходы коммуникации. ## Где встречается - [[1. Развернуть…
wikiA2C
# A2C ## Определение Actor-Critic метод обучения с подкреплением, использующий параллельный сбор данных для стабилизации градиентов. ## Где встречается - [[334. Как вы…
wikiA3C
# A3C ## Определение Асинхронная версия A2C, где несколько агентов независимо взаимодействуют со средой и обновляют общую модель. ## Где встречается - [[334. Как…
wikiMirostat
# Mirostat ## Определение Метод динамического регулирования параметров top-p или top-k для контроля перплексии при генерации текста. ## Где встречается - [[293…
wikiDQN
# DQN ## Определение Value-based алгоритм обучения с подкреплением для дискретных действий, использующий глубокую нейронную сеть для аппроксимации Q-функции. ## Где…
wikiRaft
# Raft ## Определение Протокол консенсуса для распределённых систем с явными выборами лидера. Используется в etcd для обеспечения строгой консистентности. Применяется для…
wikiIO-aware
# IO-aware ## Определение Принцип оптимизации алгоритма, учитывающий количество обращений к памяти (HBM) и обмен данными между SRAM и HBM, а…
wikiREINFORCE
# REINFORCE ## Определение Базовый алгоритм градиента политики для обучения с подкреплением, используемый для дискретных токенов, например в VSD для обновления draft…
wikiSelective scan
# Selective scan ## Определение Ключевая операция в State Space Models (Mamba), делающая параметры A, B, C зависимыми от входных данных, что…
wikiMonte Carlo Tree Search
# Monte Carlo Tree Search ## Определение Monte Carlo Tree Search (MCTS) — алгоритм поиска по дереву, состоящий из четырёх шагов: Selection, Expansion…
wikiDiskANN
# DiskANN ## Определение Алгоритм приближённого поиска ближайших соседей (ANN), хранящий векторы на диске (NVMe) и индексы в памяти, позволяющий работать с…
wikiLambdaMART
# LambdaMART ## Определение LambdaMART — алгоритм обучения ранжированию, комбинирующий LambdaRank и градиентный бустинг (MART), оптимизирующий NDCG; широко применяется для reranking в RAG…
wikileaky bucket
# leaky bucket ## Определение Алгоритм rate limiting, в котором запросы помещаются в очередь фиксированной ёмкости и обрабатываются с постоянной скоростью, сглаживая…
wikianswer_exact_match
# answer_exact_match ## Определение Метрика, измеряющая долю случаев, когда сгенерированный ответ полностью совпадает с эталонным. ## Где встречается - [[25. Как вы…
wikiOnline softmax
# Online softmax ## Определение Алгоритм вычисления softmax по блокам без хранения всей матрицы S, использует running max и сумму экспонент для…
wikiNCCL
# NCCL ## Определение Библиотека NVIDIA для коллективных коммуникаций между GPU, критичная для multi-GPU инференса и обучения. ## Где встречается - [[307. Как…
wikiBM25
# BM25 ## Определение Классический алгоритм ранжирования по ключевым словам, использующий вероятностную модель для оценки релевантности. Часто применяется в гибридном поиске (векторный…
wikitokenizer
# tokenizer ## Определение Компонент, преобразующий текст в последовательность токенов (субсловных единиц) для обработки LLM. Влияет на количество токенов, FLOPs и стоимость…
wikiexponential backoff
# exponential backoff ## Определение Стратегия повторных попыток с увеличивающейся задержкой (например, начальная задержка 1с, множитель 2, максимальная 16с), используемая для обработки…
wikiSliding window chunking
# Sliding window chunking ## Определение Техника разбиения текста на перекрывающиеся фрагменты для сохранения контекста на границах. Используется в RAG для улучшения…
answerКак работает adversarial example для embedding моделей (атака на retrieval)?
…Используются [[Вики/Evolutionary algorithms\|эволюционные алгоритмы]] или замены на основе языковых моделей. ### 4.1. Эволюционные алгоритмы - Genetic algorithm: популяция вариантов…
wikitoken bucket
# token bucket ## Определение Алгоритм ограничения скорости запросов (rate limiting), позволяющий кратковременные всплески трафика за счёт накопления токенов в «ведре»; часто…
wikiPlanner
# Planner ## Определение Компонент, который генерирует план действий (например, в архитектуре агента) или управляет очередью запросов (например, scheduler в vLLM). ## Где…
wikiProximal Policy Optimization
# Proximal Policy Optimization ## Определение Алгоритм обучения с подкреплением с клиппингом, используемый в RLHF для стабильного обучения. ## Где встречается - [[36. Что…
practiceТЕХНИЧЕСКОЕ ЗАДАНИЕ: Реализовать leader election для агентов (алгоритм Bully)
…Критерии приемки (Definition of Done) - [ ] [[Вики/Code\|Код]] агента реализует [[Вики/Bully algorithm\|алгоритм Bully]] с сообщениями ELECTION, OK, [[Вики…
wikibias
# bias ## Определение Систематическое отклонение в оценках или предсказаниях модели, которое может усиливаться при обучении на синтетических данных или через RLHF…
answerКак вы защищаете multi-agent систему от вредоносного агента?
…datetime.datetime.utcnow() + datetime.timedelta(hours=1) } return jwt.encode(payload, secret, algorithm="HS256") def verify_token(token, secret): try…
practiceТЕХНИЧЕСКОЕ ЗАДАНИЕ: Сравнить производительность NCCL ring и tree алгоритмов на разном масштабе GPU
…Сохранить финальную таблицу результатов в CSV: `ncc_algorithm_crossover.csv`. 3. Написать краткое заключение (1–2 абзаца): при каком масштабе…
wikiFlashAttention
# FlashAttention ## Определение Memory-efficient механизм внимания с IO-aware дизайном, использующий tiling, recomputation и kernel fusion для снижения сложности по…
answerКакие книги или ресурсы вы рекомендуете по Harness Engineering?
…Рекомендация прочитать первую главу (Background), [[Вики/Partition\|раздел]] 4 ([[Вики/Partial Harnessing\|Partial Harness]] Algorithm) и Appendix B (Experimental Setup…
practiceТЕХНИЧЕСКОЕ ЗАДАНИЕ: Реализовать data locality scheduler
…201 | Network topologies and latency models | | 315 | Task scheduling algorithms (FIFO, fairness, capacity) | | 409 | Locality‑aware scheduling in MapReduce | | 522…
practiceТЕХНИЧЕСКОЕ ЗАДАНИЕ: Настроить hot shard detection
…Cluster slot migration commands | | 745 | Designing a custom rebalancing algorithm | | 819 | Grafana dashboards for cache metrics | | 891 | Capacity planning for…
answerЧто такое TVM (Apache TVM) и зачем он нужен для AI инференса?
…используется [[Вики/XGBoost\|XGBoost]] или [[Вики/Evolutionary algorithms\|эволюционные алгоритмы]] для предсказания лучших конфигураций. [[Вики/AutoScheduler\|AutoScheduler]] ([[Вики/AutoScheduler\|Ansor…
practiceТЕХНИЧЕСКОЕ ЗАДАНИЕ: Реализовать selective scan (Mamba)
…stability of exp() in long sequences | | 734 | Parallel scan algorithms (prefix sum) | | 845 | Gradient computation for linear recurrence | --- ## 10. Чек…
answerКак вы защищаете RAG-систему от утечки данных между клиентами (multi-tenant isolation)?
…payload = jwt.decode(token, SECRET_KEY, algorithms=["HS256"]) return payload["tenant_id"] # Проверка при сохранении документа @app.post("/documents") def…
answerЧто такое EAGLE-3 и чем он отличается от стандартного speculative decoding?
…3 — это третий этап эволюции семейства методов EAGLE (Extrapolation Algorithm for Greater Language-model Efficiency), которые относятся к feature-aware…
practiceТЕХНИЧЕСКОЕ ЗАДАНИЕ: Настроить correlation между метриками (граф зависимостей retrieval latency → LLM latency)
…Использовать библиотеку `[[Вики/causalnex\|causalnex]]` для автоматического обучения [[Вики/DAG orchestration\|DAG]] из данных ([[Вики/PC algorithm\|алгоритм PC]] или…
answerЧто такое Tool System в Harness (defineTool, registry, JSON schema validation, rate limiting)?
…Как реализовано в [[Вики/Harness Engineering\|Harness]] Чаще всего используется токен-ба́кет ([[Вики/token bucket\|token bucket algorithm]]): - Каждому инструменту…
wikiИндекс терминов
…insert|bulk insert]] - [[Вики/bulkhead|bulkhead]] - [[Вики/Bully algorithm|Bully algorithm]] - [[Вики/Bulyan|Bulyan]] - [[Вики/bunched kernel launches|bunched kernel…
indexПРАКТИЧЕСКИЙ ЧЕКЛИСТ: СТАFF+ AI SYSTEMS ENGINEERING
…conditions| |294|Реализовать leader election для агентов|Raft/Bully algorithm|При падении лидера — перевыбор| |295|Настроить coordination metrics|Количество коллабораций…