Поиск

wikidocument injection
# document injection ## Определение Атака на RAG-систему, при которой злоумышленник загружает вредоносный документ, содержащий скрытые инструкции, изменяющие поведение модели. ## Где…
answerКак вы защищаете RAG от document injection (вредоносные документы в базе знаний)?
…Как вы защищаете RAG от document injection (вредоносные документы в базе знаний)? ## Краткий тезис [[Вики/document injection\|Document injection]] — это…
answerКак вы защищаете LLM от prompt injection через RAG (когда документ содержит инструкцию)?
…документа | Датасет известных injection-атак | Пример реализации LLM-детектора на Python ```python def is_injection_document(doc_text: str, detector…
wikisource whitelist
# source whitelist ## Определение Белый список доверенных источников, ограничивающий загрузку документов для предотвращения document injection и poisoning. ## Где встречается - [[800+ вопросов…
answerЧто такое malicious embeddings (атака через векторные БД)?
…Как вы защищаете RAG от document injection (вредоносные документы в базе знаний)\|609]] | Prompt injection в RAG | | [[611. Как работает…
answerЧто такое модель «Least Privilege» для AI-агентов и как её реализовать?
…Вредоносный [[Вики/Prompt engineering\|запрос]] (через [[Вики/Prompt injection\|prompt injection]]) может заставить агента удалить все файлы, использовать [[Вики/token…
answerЧто такое Indirect Prompt Injection через RAG и как защититься?
…Что такое Indirect Prompt Injection через RAG и как защититься? ## Краткий тезис [[Вики/Indirect Prompt Injection\|Indirect Prompt Injection]] — это…
wikiTesseract OCR
…Что такое LayoutLMv3 и зачем он для document understanding|553. Что такое LayoutLMv3 и зачем он для document understanding]] - [[556…
answerКак проектировать agent permissions (least privilege модель)?
…Рекомендуется следовать синтаксису `[[Вики/action\|action]]:resource`: `read:[[Вики/documents\|documents]]`, `write:user_profile_own`. ### Примеры типовых scopes для агента…
answerКак вы защищаете RAG от data poisoning через неявные инструкции (subtle injections)?
…В отличие от **prompt injection** (где атака идёт через пользовательский запрос), здесь источник угрозы — сам документ. **[[Вики/subtle injections\|Неявные…
answerЧто такое adversarial retrieval (атака на retrieval компонент)?
…Защита включает регуляризацию [[Вики/retrieval\|retrieval]] (например, [[Вики/noise injection\|добавление шума]] к эмбеддингам), установку порога схожести ([[Вики/confidence score…
practiceТЕХНИЧЕСКОЕ ЗАДАНИЕ: Настроить write-through cache
…Реализуйте базовый CRUD-эндпоинт (`routers/documents.py`): - `GET /documents/{id}` — чтение из кэша (пока без кэша). - `[[Вики/HTTP PUT\|PUT…
wikiметаданные
…Как вы защищаете RAG от data poisoning через неявные инструкции (subtle injections)|624. Как вы защищаете RAG от data poisoning…
answerКак защитить RAG от poisoning (вредоносные документы в базе знаний)?
…Как вы защищаете RAG от document injection (вредоносные документы в базе знаний)\|609]] | Как обеспечить безопасность RAG от атак? | | 882…
answerЧто такое Model Poisoning в контексте RAG и как защититься?
…Это комбинированная атака [[Вики/Model Poisoning\|Model Poisoning]] + [[Вики/Prompt injection\|Prompt Injection]]. ### 2.3. Атака через релевантность (Relevance Poisoning…
answerКак вы защищаете RAG-систему от утечки данных между клиентами (multi-tenant isolation)?
…если злоумышленник получил доступ к [[Вики/API\|API]] векторного хранилища, он может запросить все векторы без фильтра. - [[Вики/Prompt injection…
answerКак спроектировать систему, где LLM должна работать с конфиденциальными данными (медицина, финансы)?
…results = analyzer.analyze(text=text, language='ru') anonymized = anonymizer.anonymize(text=text, analyzer_results=results) return anonymized.text document = "Пациент…
answerКак вы делаете длинный контекст для RAG (100k+ токенов в контексте)?
…потеря деталей, возможное [[Вики/noise injection\|искажение]] смысла, дополнительный [[Вики/Latency\|latency]] на генерацию [[Вики/summarization\|саммари]]. --- ## 5. Selective pruning…
answerЧто такое adversarial retrieval (атака на retrieval компонент RAG)?
…В отличие от атак на саму [[Вики/LLM\|LLM]] (например, [[Вики/промпт агента\|prompt]] [[Вики/Prompt injection\|injection]]), здесь атакующий…
answerЧто такое EU AI Act и как оно влияет на деплой LLM в production?
…7. [[Вики/Safetysecurity\|Security]] — тестировать на [[Вики/Prompt injection\|prompt injection]], [[Вики/Adversarial attacks\|adversarial attacks]]. Пример пайплайна для high…
answerКак автоматизировать test generation для агента?
…Преимущества: - Эффективен для поиска уязвимостей (prompt injection, краши). - Минимальные затраты на подготовку — нужно только начальное множество запросов. Недостатки: - Очень много…
wikiИндекс терминов
…Вики/document classification|document classification]] - [[Вики/document injection|document injection]] - [[Вики/Document length|Document length]] - [[Вики/Document Loader|Document Loader…
answerКак вы шифруете данные для RAG (конфиденциальность)?
…Что такое Prompt Injection и как вы защищаетесь\|67]] | Какие существуют техники анонимизации текста перед индексацией? | | [[69. Как вы организуете…
answerКак вы уменьшаете галлюцинации в RAG?
…Что такое Prompt Injection и как вы защищаетесь\|67]] | Prompt injection (галлюцинации от вредоносных запросов) | | [[96. Как вы предотвращаете галлюцинации…
answerКак вы обрабатываете запросы, на которые нет ответа в документах?
…Что такое Prompt Injection и как вы защищаетесь\|67]] | Prompt injection (защита от вредоносных запросов) | | [[86. Как вы решаете проблему…
answerКак детектировать и предотвращать vector DB poisoning?
…Создайте векторную БД ChromaDB с коллекцией `documents`. 2. Реализуйте эндпоинт `/add_document`, который принимает JSON: `{"text": "...", "vector": [...]}`. 3. Добавьте проверку…
answerКак работает model inversion атака (восстановление training данных)?
…Как вы защищаете RAG от document injection (вредоносные документы в базе знаний)\|609]] - Индекс: [[00. Индекс разборов]]
answerКак делать feature engineering для RAG (кроме текста)?
…injection только | Малая стоимость, гибкость | Загружает контекст LLM, не улучшает retrieval этап | ## 10. Инструменты для реализации - [[Вики/LangChain\|LangChain]] — `DocumentTransformer…
indexИндекс разборов
…Как вы защищаете RAG от document injection (вредоносные документы в базе знаний)\|609. Как вы защищаете RAG от document injection…
answerЧто такое packing sequences и зачем он нужен?
…Как работает selective activation recomputation\|480]] | Что такое document masking в контексте RAG? | --- ## Навигация (Obsidian) - Предыдущий: [[466. Что такое curriculum…
answerКак вы делаете агента «забывающим» (для GDPR / privacy compliance)?
…dict): # Добавляем документ с метаданными, содержащими user_id self.collection.add( documents=[text], metadatas=[{**metadata, "user_id": self.user_id…
question_bankЧАСТЬ 1: RAG-СИСТЕМЫ (20 вопросов)
…Как вы защищаете RAG от document injection (вредоносные документы в базе знаний)?** > _Ответ:_ Злоумышленник загружает документ, который изменяет поведение RAG…
indexОглавление
…Как вы защищаете RAG от document injection (вредоносные документы в базе знаний)\|609. Как вы защищаете RAG от document injection…