Поиск
- wikiconditional vectors
# conditional vectors ## Определение Векторы, добавляемые к эмбеддингам для управления генерацией в ReFT. Позволяют настраивать поведение модели без полного fine-tuning…
- answerЧто такое Memory-optimized ANN и какие алгоритмы лучшие для ограниченной RAM (<16GB)?
…Практические приёмы для ограниченной RAM ### 4.1 Хранить векторы на диске, кэшировать популярные Идея Векторы лежат в файле ([[Вики/mmap…
- answerКак работает DiskANN и когда он нужен?
…Он строит графовую структуру [[Вики/Vamana\|Vamana]], где вершины — векторы, а [[Вики/edges\|рёбра]] — связи между близкими соседями. [[Вики/индексы…
- wikiAdditive Quantization
# Additive Quantization ## Определение Обобщение Product Quantization, где векторы квантуются суммой нескольких центроидов, что повышает точность аппроксимации. ## Где встречается - [[224. OPQ…
- wikiInference attack
# Inference attack ## Определение теоретическая возможность восстановить векторы другого тенанта ## Где встречается - [[123. Как вы защищаете RAG-систему от утечки данных…
- wikiVamana
…Узлы — векторы, ссылки на диске, обеспечивающие эффективный поиск при больших объёмах данных. ## Где встречается - [[525. Как вы управляете cost хранения…
- wikiIA³
# IA³ ## Определение Метод PEFT, обучающий векторы масштабирования для ключей, значений и слоёв FFN (аналогично IA3). Позволяет тонко настраивать модель с…
- wikiPrompt-tuning
# Prompt-tuning ## Определение Метод настройки языковой модели, при котором обучаются только soft prompts (входные векторы), не изменяя веса самой модели…
- wikirandom features
# random features ## Определение Векторы, полученные случайной проекцией и нелинейностью, используемые для аппроксимации softmax attention в моделях с линейной сложностью (например…
- wikiresidual vectors
# residual vectors ## Определение Векторы остатков, используемые в алгоритмах приближённого поиска ближайших соседей, таких как HNSW, для кодирования разности между исходным…
- wikiReFT
# ReFT ## Определение Метод параметро-эффективного fine-tuning, который обучает интервенции на скрытых представлениях модели, добавляя условные векторы к эмбеддингам. ## Где…
- wikiDynamic index update
# Dynamic index update ## Определение Возможность HNSW добавлять и удалять векторы из индекса без полного перестроения графа, что важно для потоковых…
- wikivector DB poisoning
# vector DB poisoning ## Определение Атака на RAG-систему, при которой злоумышленник внедряет вредоносные векторы в векторную БД для подмены контекста…
- wikiНесопоставимость пространств
# Несопоставимость пространств ## Определение Ситуация, когда векторы, полученные разными эмбеддинг-моделями, лежат в различных латентных пространствах, из-за чего косинусная близость…
- answerКак вы проектируете векторную БД с миллиардом векторов при ограниченном бюджете?
…строит [[Вики/Graph\|граф]] ([[Вики/Vamana\|Vamana]]), где вершины — векторы. [[Вики/Graph\|Граф]] хранится на диске, но «горячие» [[Вики/nodes…
- answerКак вы управляете cost хранения векторной БД при миллиарде векторов?
…Tiered Storage — многоуровневое хранение **[[Вики/Tiered storage\|Tiered storage]]** разделяет векторы по частоте запросов (access pattern) на уровни: | Уровень | Носитель…
- wikiIA3
# IA3 ## Определение Метод Parameter-Efficient Fine-Tuning (PEFT), который обучает векторы масштабирования для активаций ключей, значений и слоёв FFN, позволяя…
- wikiQuery/Key/Value vectors
# Query/Key/Value vectors ## Определение В механизме внимания (attention) входные векторы преобразуются в три набора: Query (запрос), Key (ключ) и…
- wikicross-region replication
…метаданные реплицируются синхронно, векторы — асинхронно. ## Где встречается - [[254. Как вы проектируете disaster recovery для LLM системы при сбое региона|254…
- answerКак работает Product Quantization (PQ) для сжатия векторов?
…Алгоритм обучения PQ ### 3.1 Разбиение на подпространства Исходные векторы обучающей выборки (например, все векторы базы) делятся на M групп…
- answerЧто такое IVF (Inverted File Index) и как он сравнивается с HNSW по speed/quality?
…Сравнение по memory (RAM) | Компонент | IVF | HNSW | |-----------|-----|------| | Хранение векторов | Обычно хранятся исходные векторы (float32) или сжатые (PQ). | Хранятся исходные векторы…
- wikiPrefix-tuning
# Prefix-tuning ## Определение Метод fine-tuning, добавляющий обучаемые префиксные векторы к слоям self-attention; требует мало ресурсов. ## Где встречается - [[22…
- answerКак детектировать и предотвращать vector DB poisoning?
…Такие «ядовитые» векторы становятся невидимыми фильтрами и обходят обычные проверки контента. --- ## 2. Мотивация: почему это опасно для RAG? [[Вики/RAG…
- wikiDiskANN
# DiskANN ## Определение Алгоритм приближённого поиска ближайших соседей (ANN), хранящий векторы на диске (NVMe) и индексы в памяти, позволяющий работать с…
- answerКак работает мультимодальный RAG с unified retrieval (один индекс для текста и изображений)?
…Она создаёт общее эмбеддинг-пространство, где близкие по смыслу текст и картинка имеют похожие векторы. Это ключевой компонент retrieval|unified…
- answerКак вы обновляете ANN индекс при добавлении новых векторов без перестроения?
…новые векторы добавляются в ближайший [[Вики/cluster\|кластер]], но центроиды не обновляются — кластеры смещаются, [[Вики/accuracy\|точность]] падает. - [[Вики/Product…
- answerScaNN (Google) vs HNSW — сравнение для больших масштабов (>100M векторов)?
…Строит многослойную структуру: - Нижний слой содержит все векторы. - Верхние слои — разреженные подмножества, обеспечивающие быстрый «дальний» переход. - [[Вики/retrieval\|Поиск]] начинается…
- answerКакую векторную БД вы выберете для production-системы с >1 млн векторов?
…O(log n) для ANN, но приближённо | | Хранит строки, числа, даты | Хранит векторы (массивы чисел) + метаданные | Термин «[[Вики/ANN\|ANN…
- answerКак вы управляете cost хранения векторной БД при миллиарде векторов?
…В DiskANN векторы хранятся сжатыми, а при поиске вычисляется приблизительное расстояние через кодбуки. Пример конфигурации Faiss: ```python import faiss dim…
- answerЧто такое Hierarchical Navigable Small World + IVF (HNSW+IVF) гибрид?
…все векторы датасета кластеризуются алгоритмом [[Вики/K-means\|k-means]] на `[[Вики/nlist\|nlist]]` кластеров. Получаются центроиды `C = {c1, ..., c…
- wikihidden representations
# hidden representations ## Определение Внутренние векторы активаций слоёв модели, используемые в методах speculative decoding (EAGLE-3), интервенциях (ReFT) и тест-тайм…
- answerКак избежать hot shard в Qdrant (или другой векторной БД)?
…Написать симулятор запросов - Генерировать векторы (256d) с метаданными: `user_id` (1..1000), `category` (1..10). - Направлять 80% запросов на `category…
- practiceТЕХНИЧЕСКОЕ ЗАДАНИЕ: Реализовать compaction в векторной БД
…Создать Python-скрипт, который в цикле вставляет новые векторы (по 1000 за раз) в коллекцию [[Вики/qdrant-client\|Qdrant]] с…
- answerКак вы делаете blue-green deployment для RAG системы с zero downtime?
…Нужно убедиться, что orchestrator Green ожидает именно такие векторы. - Если меняется prompt template, ответы могут отличаться по стилю — это нормально…
- answerКак вы делаете RAG для видео (индексация subshots, аудио, ключевые кадры)?
…Ищем ближайшие векторы subshots в БД по косинусной близости. Возвращаем top-k subshots. Далее возможны два подхода: - Прямая генерация: передаём…
- answerКак вы измеряете recall@k для ANN индекса и какой порог acceptable?
…если в базе есть одинаковые векторы, [[Вики/brute force\|точный поиск]] может вернуть любой из них, а [[Вики/ANN\|ANN…
- wikitext-embedding-3-small
# text-embedding-3-small ## Определение Модель эмбеддингов от OpenAI, преобразующая текст в плотные векторы фиксированной размерности. Используется в RAG для…
- answerКак вы защищаете RAG-систему от утечки данных между клиентами (multi-tenant isolation)?
…если злоумышленник получил доступ к [[Вики/API\|API]] векторного хранилища, он может запросить все векторы без фильтра. - [[Вики/Prompt injection…
- answerКак вы обновляете embedding модель без полной переиндексации?
…семантически близкие тексты имеют близкие векторы в пространстве ([[Вики/No hallucination\|косинусная близость]] или [[Вики/scalar product\|скалярное произведение]]). При…
- answerКак вы делаете backfill эмбеддингов при смене embedding модели?
…новая модель генерирует эмбеддинги в другом пространстве, поэтому старые векторы становятся несовместимыми. Ключевой подход — стратегия двух индексов: старый индекс остаётся…
- answerКак вы объединяете несколько LoRA адаптеров для разных задач?
…Пример кода ([[Вики/numpy\|NumPy]]): ```python import numpy as np def slerp(v1, v2, alpha): # нормируем векторы v1_norm = v1…
- practiceТЕХНИЧЕСКОЕ ЗАДАНИЕ: Настроить Memory (in-memory + vector)
…Для production — quantized версии. | | Дублирование фактов | При `store` сначала искать похожие векторы (top_k=1 с порогом >0.95). Если…
- answerКак работает RoPE (Rotary Position Embedding) и чем лучше абсолютных позиций?
…если перемешать входные векторы, attention-веса не изменятся. Чтобы внести информацию о позиции каждого токена в последовательности, используются позиционные кодировки…
- answerЧто такое Learned Index Structures for ANN? Новые подходы 2025-2026?
…ℝᵈ → [0,1]**, если нормализовать), которая для вектора-запроса [[википредсказываетпредсказывает]] ([[Вики/bias\|offset]]) в массиве, где хранятся векторы, отсортированные по…
- answerКак проектировать ETL vs ELT для RAG?
…выполнить трансформацию один раз, проверить качество и загрузить готовые векторы. Контроль качества на входе В [[Вики/ETL\|ETL]] проще добавить…
- answerЧто такое Chain-of-Thought без токенов (latent CoT) и как это реализовано?
…Сравнение обычного CoT и latent CoT | Характеристика | Обычный CoT (текстовый) | Latent CoT (скрытый) | |----------------|------------------------|----------------------| | Форма рассуждений | Дискретные токены | Непрерывные векторы | | [[Вики…
- answerКак вы делаете backfill эмбеддингов при смене embedding модели?
…Термин [[Вики/Несопоставимость пространств\|«Несопоставимость пространств»]] ([[Вики/Несопоставимость пространств\|embedding space misalignment]]) — векторы, полученные разными моделями, лежат в разных латентных…
- practiceТЕХНИЧЕСКОЕ ЗАДАНИЕ: Реализовать active learning loop
…из `sentence-transformers/all-MiniLM-L6-v2` (384-мерные векторы) | | Стратегия отбора примеров | Реализовать uncertainty sampling: минимальная уверенность (least confidence…
- answerЧто такое jailbreak taxonomy (OOD, refusal suppression, role-play, перевод)?
…Позволяет понять, какие векторы атак чаще используются. --- ## 11. Связь с другими вопросами | Вопрос | Тема | |--------|------| | [[598. Как работает embedding poisoning для…
- practiceТЕХНИЧЕСКОЕ ЗАДАНИЕ: RAG с векторной БД на CPU (Chroma/Qdrant)
…Загрузить векторы в [[Вики/Chroma\|Chroma]]: ```python import chromadb client = chromadb.PersistentClient(path="./chroma_db") collection = client.create_collection(name…