Поиск
- wikidomain shift
# domain shift ## Определение Несоответствие распределения данных между обучением модели и целевым доменом, приводящее к ухудшению качества на специфических областях (например…
- wikiactive learning loop
…и повторное обучение для улучшения retrieval. ## Где встречается - [[531. Как вы делаете active learning loop для улучшения retrieval|531. Как…
- wikiOnline learning
# Online learning ## Определение Инкрементальное обновление модели по мере поступления данных без переобучения с нуля, подходит для retrieval-ранжировщиков и агентов…
- wikiself-supervision
…Как вы делаете image retrieval с фильтрацией по метаданным (дата, местоположение, камера)|563. Как вы делаете image retrieval с фильтрацией…
- wikiLightGBM
# LightGBM ## Определение Популярная библиотека градиентного бустинга, поддерживающая обучение ранжирующих моделей (LGBMRanker) с objective='lambdarank'. Используется для классификации, регрессии и learning…
- answerКак работает Toolformer (обучение агента использованию инструментов)?
…Как работает Toolformer (обучение агента использованию инструментов)? ## Краткий тезис [[Вики/Toolformer\|Toolformer]] — это метод, предложенный Meta AI, который обучает языковую…
- wikilearning-to-rank
# learning-to-rank ## Определение Класс методов машинного обучения для упорядочивания документов по релевантности запросу; применяется в retrieval для LLM, например…
- answerКак работает Toolformer-like обучение для агентов (self-supervised tool use)?
…3]]) научиться использовать инструменты (калькулятор, [[Вики/retrieval\|поисковик]], переводчик, календарь) через [[Вики/training\|обучение]] на текстовых корпусах. Ключевая идея — [[Вики…
- answerЧто такое Model Poisoning в контексте RAG и как защититься?
…Когда [[Вики/multi-tenant\|пользователь]] задаёт [[Вики/Prompt engineering\|запрос]], [[Вики/retrieval\|retrieval]] находит этот вредоносный документ, [[Вики/GPT-4o…
- answerКак оптимизировать траектории агента (trajectory optimization)?
…Например, `[[Вики/retrieval\|search]]('salary Munich')` и `[[Вики/retrieval\|search]]('salary Berlin')` → `[[Вики/retrieval\|search]]('salary in Munich and Berlin…
- answerЧто такое SigLIP и чем отличается от CLIP?
…shot]], [[Вики/retrieval\|retrieval]]) и лучше масштабируется до миллиардов пар изображение-текст. --- ## 1. Термин: CLIP и контрастивное обучение CLIP (Contrastive…
- answerКакие embedding-модели для мультимодального поиска вы используете? CLIP, BLIP-2, ImageBind?
…Вики/embedding\|эмбеддинги]] → [[Вики/retrieval\|поиск]] по косинусной близости. --- ## 3. BLIP-2 ### Архитектура и обучение [[Вики/BLIP-2\|BLIP‑2…
- wikilearning rate
…Реализовать hard negative mining для retrieval|269. Реализовать hard negative mining для retrieval]] - [[273. Реализовать curriculum learning|273. Реализовать curriculum…
- wikiconfidence score
…Как вы калибруете retrieval confidence для threshold-based filtering|375. Как вы калибруете retrieval confidence для threshold-based filtering]] - [[393…
- answerКак вы делаете agent с bounded rationality (ограниченные вычислительные ресурсы)?
…Мета-обучение (прогнозирование сложности задачи) **[[Вики/meta-learning\|Мета-обучение]]** — [[Вики/training\|обучение]] отдельной модели (или самого [[Вики/GPT-4o…
- wikicontrastive loss
…Как вы делаете RAG для изображений (image retrieval without text)|541. Как вы делаете RAG для изображений (image retrieval without…
- answerКак вы тестируете RAG-систему на новых документах без реальных пользователей?
…Как вы оцениваете качество retrieval'а в RAG-системе\|5]] | Как оценивать качество retrieval в RAG | | [[9. Как вы обновляете…
- answerHyena: как заменить attention на свертки, сохранив качество?
…Однако **[[Вики/retrieval\|retrieval]]** ([[Вики/retrieval\|поиск]] релевантных чанков) всё равно необходим, так как [[Вики/Hyena\|Hyena]] не решает проблему…
- answerЧто такое LambdaMART и как он используется для reranking в RAG?
…сначала дешёвый [[Вики/retrieval\|поиск]] ([[Вики/Bi-encoder\|bi-encoder]] или [[Вики/Sparse computation\|sparse]] [[Вики/retrieval\|retrieval]]) выдаёт [[Вики…
- answerКак вы проектируете feature store для ML фичей, используемых LLM?
…Интеграция с LLM (retrieval + prompt) ### 7.1 Retrieval через эмбеддинги ```python # Получаем user_embedding из feature store user_embedding = store…
- wikiadversarial training
…Что такое adversarial retrieval (атака на retrieval компонент RAG)|599. Что такое adversarial retrieval (атака на retrieval компонент RAG)]] - [[600…
- wikiFew-shot examples
…Как вы делаете retrieval для структурированных данных (SQL, Knowledge Graph)|377. Как вы делаете retrieval для структурированных данных (SQL, Knowledge…
- answerКак работает model stealing attack (экстракция модели через API)?
…Как вы оцениваете качество retrieval'а в RAG-системе\|5]] | Оценка retrieval — атака может использовать retrieval для генерации промптов | | [[10…
- answerКак работает мультимодальное выравнивание (alignment) в моделях типа Chameleon (Meta)?
…contrastive loss\|Контрастивное обучение]] | CLIP | Два энкодера (текст+изображение) обучаются сближать embeddings пар | Эффективен для retrieval, не требует генерации | Не…
- answerScaNN (Google) vs HNSW — сравнение для больших масштабов (>100M векторов)?
…ANN, recall, latency, quantization **Приближённый [[Вики/retrieval\|поиск]] ближайших соседей ([[Вики/ANN\|ANN]])** — класс алгоритмов, которые находят не точные, а…
- wikiZero-shot
…Как вы делаете image retrieval с фильтрацией по метаданным (дата, местоположение, камера)|563. Как вы делаете image retrieval с фильтрацией…
- answerЧто такое Self-RAG и когда его использовать?
…Parallel Retrieval (параллельный поиск) │ │ Retrieval находит K документов (например, 10) │ └─────────────────────────────────────────────────────────────┘ │ ▼ ┌─────────────────────────────────────────────────────────────┐ │ Шаг 3: Critique (оценка документов) │ │ Для каждого документа D_i…
- answerЧто такое adversarial retrieval (атака на retrieval компонент)?
…В **[[Вики/adversarial retrieval\|adversarial retrieval]]** атака направлена на индексацию/поиск, а не на [[Вики/training\|обучение]]. --- ## 2. Как работает…
- answerКак вы делаете query rewriting и query expansion в RAG?
…Обе техники повышают **[[Вики/accuracy\|recall]]** (полноту поиска) и качество [[Вики/retrieval\|retrieval]], особенно для коротких, разговорных или нечётких запросов…
- answerКак вы калибруете retrieval confidence для threshold-based filtering?
…retrieval confidence, threshold-based filtering, калибровка [[Вики/confidence score\|Retrieval confidence]] — это [[Вики/Evaluation\|score]], который retrieval-модель (например, на…
- practiceТЕХНИЧЕСКОЕ ЗАДАНИЕ: Реализовать hard negative mining для retrieval
…Цель задачи Разработать автоматизированный [[Вики/пайплайн\|пайплайн]] [[Вики/hard negatives\|hard negative mining]] на основе [[Вики/retrieval\|retrieval]] логов, который…
- answerКак работает multi-agent with role specialization (агенты-эксперты в разных доменах)?
…Expert Agent обрабатывает запрос, используя свой [[Вики/retrieval pipeline\|retrieval pipeline]] (векторная БД, специфичные чанки). 5. Если требуется междисциплинарный ответ…
- answerКак работает process reward model (PRM) vs outcome reward model (ORM)?
…число (обычно между 0 и 1) — оценка качества всего ответа. - [[Вики/training\|Обучение]]: обычно бинарная классификация (правильный/неправильный) на датасете…
- answerКогда вы выбираете fine-tuning вместо RAG, а когда — наоборот?
…Знания не хранятся в весах модели, а подгружаются динамически из **[[Вики/retrieval\|retrieval]]** (поиска). | Аспект | Fine-tuning | RAG | | :--- | :--- | :--- | | Хранение знаний…
- answerЧто такое adversarial retrieval (атака на retrieval компонент RAG)?
…Что такое adversarial retrieval (атака на retrieval компонент RAG)? ## Краткий тезис [[Вики/adversarial retrieval\|Adversarial retrieval]] — это целенаправленная атака на…
- answerКак работает CLIP и как training contrastive loss выравнивает текст и изображения?
…В результате эмбеддинги текста и изображений оказываются выровнены в общем пространстве, что позволяет выполнять zero-shot классификацию и retrieval|мультимодальный…
- wikicross-entropy loss
…Как вы калибруете retrieval confidence для threshold-based filtering|375. Как вы калибруете retrieval confidence для threshold-based filtering]] - [[456…
- answerЧто такое индуктивные biases трансформеров? (positional invariance, order sensitivity)?
…Bias: «каждый токен обрабатывается независимо после смешивания информации». - Layer normalization bias стабилизирует обучение, но вносит предположение, что распределения активаций должны…
- answerЧто такое skill libraries для агентов и как их создавать?
…Пример: [[Вики/skill\|skill]] `send_report_to_manager` может внутри себя: - выполнить [[Вики/retrieval\|search]] ([[Вики/retrieval\|поиск]] по БД…
- answerЧто такое curriculum learning для LLM и как его реализовать?
…сначала простые retrieval-запросы, затем [[Вики/multi-step retrieval\|multi-hop]], затем [[Вики/planning\|планирование]] с инструментами. --- ## 8. Преимущества и…
- answerКак измерять ROI от fine-tuning (окупается ли дообучение более дешёвым инференсом)?
…В контексте [[Вики/SFT\|fine-tuning]] — отношение чистой прибыли (экономии на инференсе за вычетом затрат на [[Вики/training\|обучение]]) к…
- practiceТЕХНИЧЕСКОЕ ЗАДАНИЕ: Настроить correlation между метриками (граф зависимостей retrieval latency → LLM latency)
…Цель задачи Разработать систему автоматического построения графа причинно-следственных связей между метриками задержки этапа [[Вики/retrieval\|retrieval]] и задержки генерации…
- answerКак работает эмбеддинг слой и почему его размер (embedding dimension) важен?
…retrieval: модели и метрики | --- ## Навигация (Obsidian) - Предыдущий: [[670. Что такое loss landscape LLM и как оно влияет на обучение (sharp…
- answerЧто такое hybrid search с весами (weighted hybrid) и как оптимизировать веса?
…Хорош для парафраз, синонимов, общих концепций. - **[[Вики/ключевой поиск\|Лексический поиск]] ([[Вики/ключевой поиск\|sparse retrieval]])** — [[Вики/retrieval\|поиск]] по…
- answerПочему агенты деградируют на длинных horizon (более 10 шагов)?
…давать +0.1 за каждый успешный retrieval. - **Reward shaping** на основе верификаторов (см. раздел 8). - [[Вики/behavior cloning\|Имитационное обучение…
- answerКак работает adversarial example для embedding моделей (атака на retrieval)?
…Цель атаки на **[[Вики/retrieval\|retrieval]]** — заставить поисковую систему вернуть этот документ по нерелевантному запросу (например, документ о кошках оказывается…
- answerКак реализовать online/offline feature consistency для LLM?
…почему возникает неконсистентность Признаки для обучения LLM-моделей (или для retrieval/ранжирования в RAG-агентах) часто вычисляются из исторических логов…
- answerЧто такое planner/executor architecture для агентов и когда она нужна?
…Спланировать шаги ([[Вики/retrieval\|поиск]] статей, [[Вики/retrieval\|извлечение]] ключевых пунктов, сравнение источников, написание [[Вики/summarization\|summary]]). 2. Выполнить шаги…
- answerКак вы измеряете uncertainty в ответах LLM (logit-based vs ensemble methods)?
…если retrieval score низкий (< порога) И generation uncertainty высокая → отказ от ответа. Если retrieval score высокий, но generation uncertainty высокая…
- answerКак вы делаете image retrieval с фильтрацией по метаданным (дата, местоположение, камера)?
…image retrieval, метаданные, эмбеддинги [[Вики/image retrieval\|Image retrieval]] — [[Вики/Task\|задача]] поиска изображений по визуальному сходству или семантическому запросу…