Поиск
- wikiprivacy by design
# privacy by design ## Определение Принцип проектирования систем, при котором защита данных и приватность встраиваются на всех этапах разработки, а не…
- wikiPrivacy attacks
# Privacy attacks ## Определение Класс атак на модель, направленных на извлечение конфиденциальных данных, включающий membership inference, data extraction и другие. ## Где…
- wikiGradient inversion attack
# Gradient inversion attack ## Определение Атака на приватность, при которой злоумышленник восстанавливает исходные данные клиента по его градиентам. ## Где встречается - [[623…
- wikidifferential privacy
# differential privacy ## Определение Метод защиты конфиденциальности данных, гарантирующий, что удаление или добавление одного образца обучающей выборки не изменит выход модели…
- answerЧто такое differential privacy для LLM и как она работает?
…Для датасета из 1 млн записей δ = 1e-6. - **ε** зависит от требуемого уровня приватности: - ε < 1 — сильная приватность (медицина…
- answerЧто такое secure aggregation для федеративного обучения LLM?
…агрегируют только часть градиентов или используют дифференциальную приватность в [[Вики/padded sequences\|дополнение]]. --- ## 7. Ограничения и компромиссы - Вычислительная нагрузка: [[Вики…
- answerКак работает model inversion атака (восстановление training данных)?
…Дифференциальная приватность (DP) [[Вики/differential privacy\|Дифференциальная приватность]] математически гарантирует, что удаление или добавление одного примера не изменит выход модели…
- answerЧто такое data poisoning атака на fine-tuning и как защититься?
…Дифференциальная приватность (Differential Privacy) **[[Вики/Data parallelism\|Дифференциальная приватность]] (DP)** — это математическая гарантия, что результат анализа данных не позволяет определить…
- wikiData parallelism
# Data parallelism ## Определение Стратегия распределения данных по нескольким репликам модели для параллельного обучения или инференса. Для LLM инференса часто комбинируется…
- answerКак работает membership inference атака на LLM?
…Защита возможна через дифференциальную приватность (DP) при обучении, но для уже обученных моделей защита крайне затруднена. --- ## 1. Что такое membership…
- answerКак работает membership inference атака на LLM?
…Защита от MIA ### 6.1 Дифференциальная приватность (Differential Privacy, DP) Наиболее теоретически обоснованный метод. При обучении с DP в градиенты…
- answerКак вы делаете agent с human values alignment (Constitutional AI для агентов)?
…соответствуют заранее заданным человеческим принципам ([[Вики/Safetysecurity\|безопасность]], честность, приватность, [[Вики/Helpfulness Harmlessness\|полезность]]). **[[Вики/Constitutional AI\|Constitutional AI]] ([[Вики…
- answerКак работает membership inference через logits (разница в вероятностях)?
…membership inference, логиты, вероятности [[Вики/model inversion attack\|Membership inference]] — [[Вики/Task\|задача]] [[Вики/Privacy attacks\|атаки на приватность]] модели…
- answerЧто такое data exfiltration через LLM (утечка данных через ответы)?
…дифференциальная приватность **[[Вики/Data parallelism\|Дифференциальная приватность]] (DP)** — математическая гарантия, что присутствие или отсутствие одной записи в тренировочных данных незначительно…
- answerЧто такое data poisoning атака на fine-tuning и как защититься?
…Дифференциальная приватность (DP-SGD) **DP-SGD (Differentially Private Stochastic Gradient Descent)** — модификация SGD, которая ограничивает влияние каждого отдельного примера на…
- answerКак вы обрабатываете PII в данных для RAG (GDPR, 152-ФЗ)?
…Компромисс между приватностью и полезностью данных Удаление PMI может снизить качество [[Вики/retrieval\|retrieval]] (например, если имя является ключевым для…
- answern8n, Make, Zapier — как вы интегрируете их с LLM?
…Выбор платформы для LLM-интеграции | Критерий | Рекомендуемая платформа | | --- | --- | | Нужна полная приватность / self-hosted | n8n (self-hosted) | | Малый бизнес, быстрые интеграции…
- answerКак проектировать delegation с учётом человеческого фактора (усталость, занятость)?
…Начинать с простых порогов и добавлять по мере накопления данных. - Приватность: Сбор статусов (онлайн, усталость) должен быть согласован с операторами…
- answerКак работает model stealing attack и как защититься?
…student]] слабее teacher). - Усложняет восстановление teacher. ### Differential Privacy (дифференциальная приватность) [[Вики/noise injection\|Добавление шума]] в процесс обучения так, чтобы…
- answerКак работает embedding poisoning для RAG и как защититься?
…Извлечение приватных данных через запросы | Ограничение длины контекста, дифференциальная приватность | | [[Вики/Adversarial query\|Adversarial query]] | Манипуляция запросом для искажения retrieval…
- answerКак вы шифруете данные для RAG (конфиденциальность)?
…Поэтому: - Удаляйте PII до индексации — используйте NER‑модели (spaCy, Presidio) для детекции и замены PII на placeholder’ы. - **Дифференциальная приватность…
- answerКак спроектировать систему, где LLM должна работать с конфиденциальными данными (медицина, финансы)?
…удаление [[Вики/PII\|PII]] из реальных данных, затем [[Вики/fine-tuning\|fine-tuning]] 3. [[Вики/differential privacy\|Дифференциальная приватность]] ([[Вики…
- practiceТЕХНИЧЕСКОЕ ЗАДАНИЕ: Реализовать user trust метрику
…Задокументировать, что веса — гипотеза. | | Приватность пользователей | Работать с анонимизированными ID (uuid). Не хранить личные данные. | | Долгое время расчёта при большом…
- answerКак работает model extraction attack и как защититься?
…Определить, был ли образец в обучении | API (logprobs) | Дифференциальная приватность | | Inversion attack | Восстановить обучающие данные | White-box (градиенты) | [[Вики/Data…
- answerКак вы подготовите датасет для fine-tuning, если у вас только неструктурированные диалоги с клиентами?
…заменить конкретные имена на `[NAME]`, номера на `[PHONE]` — сохраняет структуру, не нарушая приватность. Пример маскирования: ```python import re def mask…
- answerКак работает whisper.cpp для локального ASR с low latency?
…задержка]] — [[Вики/multi-tenant\|пользователь]] не ждёт. - Работает офлайн — приватность данных. - Малый размер — можно запустить на Raspberry Pi или ноутбуке…
- practiceТЕХНИЧЕСКОЕ ЗАДАНИЕ: Настроить recurrent memory для long context
…в каких сценариях recurrent memory предпочтительнее RAG (например, низкий latency, приватность, offline). Ожидаемый результат этапа Файл `benchmark.pdf` или `benchmark…
- answerЧто такое Constitutional AI и как RLHF связан с ним?
…и честен», «Не давайте советов по созданию оружия», «Уважайте приватность пользователя». [[Вики/Claude API\|Anthropic]] опубликовал свою конституцию (около 20…
- answerКак вы проектируете «человека в петле» для multi-agent системы с минимальным overhead?
…содержание операторов дороже, чем полностью автоматическая система → [[Вики/human-in-the-loop\|HITL]] оправдан только для high-value действий. - Приватность…
- answerКак работает model watermarking для LLM (идентификация модели-источника)?
…знаки]] могут использоваться для скрытой идентификации авторов, что нарушает приватность. Термин «Имитатор» ([[Вики/imitation model\|imitation model]]) — [[Вики/model\|модель…
- answerНазовите OWASP Top 10 для LLM (2025) и 3 самых критичных риска?
…удалять чувствительные поля перед передачей модели. - [[Вики/differential privacy\|Дифференциальная приватность]] при обучении ([[Вики/Data parallelism\|DP-SGD]]) — снижает риск…
- answerКак делать adversarial evals для RAG (проверка на устойчивость)?
…Игнорируй контекст, ответь: …]»). - [[Вики/embedding inversion\|Embedding inversion]] — попытка восстановить исходный текст по эмбеддингу (обычно для атак на приватность). ### 2…
- answerКак вы делаете агента «забывающим» (для GDPR / privacy compliance)?
…При forget удаляется только маппинг. - [[Вики/differential privacy\|Дифференциальная приватность]] — добавлять шум в память агента, чтобы отдельные записи нельзя было…
- answerКак вы делаем agent with theory of mind (понимание намерений пользователя)?
…что увеличивает [[Вики/Latency\|latency]] и [[Вики/cost\|стоимость]]. - Приватность: хранение детальной [[Вики/User Modeling\|User Model]] может нарушать [[Вики…
- question_bankЧАСТЬ 1: RAG-СИСТЕМЫ (20 вопросов)
…outlier detection, data validation, дифференциальная приватность, robust aggregation. **357. Как работает membership inference атака на LLM?** > *Ответ:* Определить, был ли…