Поиск

  • wikiPII leakage

    …Как происходит PII leakage через LLM и как защититься|885. Как происходит PII leakage через LLM и как защититься]] - [[800…

  • wikiДетектор PII

    # Детектор PII ## Определение Компонент проверки ответа LLM на наличие персональных данных. Запускается на выходе перед отправкой пользователю для предотвращения утечек…

  • wikiPII redaction

    # PII redaction ## Определение Удаление персонально идентифицируемой информации из документов перед индексацией или обучением. Критично для систем, работающих с конфиденциальными данными…

  • answerКак вы обрабатываете PII в данных для RAG (GDPR, 152-ФЗ)?

    …Как вы обрабатываете PII в данных для RAG (GDPR, 152-ФЗ)? ## Краткий тезис Обработка **[[Вики/PII\|PII]] ([[Вики/PII\|Personally…

  • answerКак вы обрабатываете PII в данных для RAG (GDPR, 152-ФЗ)?

    …Как вы обрабатываете PII в данных для RAG (GDPR, 152-ФЗ)? ## Краткий тезис Обработка **[[Вики/PII\|PII]] ([[Вики/PII\|Personally…

  • answerКак происходит PII leakage через LLM и как защититься?

    …Как происходит PII leakage через LLM и как защититься? ## Краткий тезис [[Вики/PII leakage\|PII leakage]] ([[Вики/PII leakage\|утечка…

  • wikiDeBERTa-NER

    # DeBERTa-NER ## Определение DeBERTa-NER — модель на основе трансформера DeBERTa для точного распознавания именованных сущностей, включая PII, применяемая в обработке…

  • wikiPII rate

    # PII rate ## Определение Метрика качества данных, показывающая долю документов, не содержащих персональных данных. Используется для мониторинга корпуса RAG. ## Где встречается…

  • wikimapping

    # mapping ## Определение Хранение связи между маскированными данными и исходными PII в отдельной защищённой БД для возможной деанонимизации. ## Где встречается - [[263…

  • wikiPII masking

    # PII masking ## Определение Замена реальных персональных данных (имён, адресов, номеров) на плейсхолдеры перед записью в логи или передачей модели. Применяется…

  • wikiPII Detection

    # PII Detection ## Определение Процесс выявления персональных данных в документах или корпусе RAG с помощью NER-моделей или правил. Необходим для…

  • wiki152-ФЗ

    …Как вы обрабатываете PII в данных для RAG (GDPR, 152-ФЗ)|263. Как вы обрабатываете PII в данных для RAG…

  • wikiPresidio

    # Presidio ## Определение Библиотека от Microsoft для обнаружения и анонимизации персональных данных (PII) в тексте. Использует комбинацию NER, регулярных выражений и…

  • wikipgcrypto

    # pgcrypto ## Определение Расширение PostgreSQL для шифрования данных на уровне столбцов, используемое для защиты PII в RAG-системах. ## Где встречается - [[263…

  • wikiExtraction attacks

    # Extraction attacks ## Определение Атаки на LLM, при которых злоумышленник специальными запросами извлекает чувствительные данные (PII), запомненные моделью в процессе обучения…

  • wikiSafety fine-tuning

    # Safety fine-tuning ## Определение Дообучение модели на парах (запрос, безопасный ответ) для улучшения её безопасности, например, для предотвращения утечки PII

  • wikiregex

    # regex ## Определение Шаблон для поиска и замены текстовых паттернов, используемый в эвристиках, детекции PII и фильтрации ввода. ## Где встречается - [[518…

  • wikiAWS KMS

    …Альтернатива HashiCorp Vault, используется для защиты PII и других чувствительных данных. ## Где встречается - [[518. Как вы обрабатываете PII в данных…

  • wikiAmazon Comprehend

    # Amazon Comprehend ## Определение Amazon Comprehend — облачный сервис AWS для анализа текста, включая обнаружение PII (персонально идентифицируемой информации). Применяется для обработки…

  • wikiAES-256

    …Как вы обрабатываете PII в данных для RAG (GDPR, 152-ФЗ)|263. Как вы обрабатываете PII в данных для RAG…

  • wikiОбезличивание

    # Обезличивание ## Определение Процесс удаления или маскировки персональных данных (PII) в соответствии с законодательством (например, 152-ФЗ) для обеспечения безопасности и…

  • wikidslim/bert-base-NER

    # dslim/bert-base-NER ## Определение Модель BERT для распознавания именованных сущностей (NER), используемая для обработки PII в RAG-пайплайнах. ## Где…

  • answerЧто такое data exfiltration через LLM (утечка данных через ответы)?

    …Проблема возникает, когда [[Вики/model\|модель]] обучена на приватной информации ([[Вики/PII\|PII]], медицинские записи, коммерческие тайны) или имеет доступ…

  • wikiPII

    …Как вы обрабатываете PII в данных для RAG (GDPR, 152-ФЗ)|263. Как вы обрабатываете PII в данных для RAG…

  • wikien_core_web_trf

    # en_core_web_trf ## Определение Трансформерная NER-модель библиотеки spaCy для английского языка, используемая для распознавания именованных сущностей (PII). ## Где…

  • wikiFaker

    # Faker ## Определение Библиотека для генерации синтетических персональных данных, используемая для fine-tuning без риска утечки реальных PII. ## Где встречается - [[518…

  • wikiGoogle DLP

    # Google DLP ## Определение Сервис Google Cloud для обнаружения и маскировки конфиденциальных данных (PII, токенов) в тексте и изображениях. Часто применяется…

  • wikiNER

    # NER ## Определение Метод обнаружения и маскировки PII (персональных данных) в тексте перед индексацией, часто реализуемый моделями spaCy, DeBERTa-NER или…

  • wikiru_core_news_lg

    …Применяется для обработки PII в данных RAG. ## Где встречается - [[263. Как вы обрабатываете PII в данных для RAG (GDPR, 152…

  • wikiПраво на забывание

    …В контексте RAG необходимо обеспечить возможность удаления PII из индексов и кэша. ## Где встречается - [[263. Как вы обрабатываете PII в…

  • wikiScrubbing

    # Scrubbing ## Определение Автоматическое удаление или маскирование конфиденциальной информации (PII) из данных с помощью регулярных выражений или NER. ## Где встречается - [[602…

  • wikiDPIA

    # DPIA ## Определение Оценка влияния на защиту данных (Data Protection Impact Assessment), обязательная для систем, обрабатывающих PII в больших масштабах. ## Где…

  • wikiContext leakage

    # Context leakage ## Определение Проблема безопасности, при которой конфиденциальные данные (PII) из системного промпта или документов RAG просачиваются в ответ модели…

  • wikiVault

    …Как вы обрабатываете PII в данных для RAG (GDPR, 152-ФЗ)|263. Как вы обрабатываете PII в данных для RAG…

  • wikiПсевдонимизация

    # Псевдонимизация ## Определение Замена персональных данных (PII) на псевдонимы, позволяющая восстановить исходные данные при наличии ключа. Используется для соблюдения GDPR при…

  • wikispaCy

    # spaCy ## Определение Библиотека NLP с предобученными моделями для задач, таких как NER и определение языка, используемая для обработки PII в…

  • wikiGDPR

    # GDPR ## Определение Европейский регламент по защите персональных данных, устанавливающий строгие требования к обработке PII: согласие субъекта, право на забвение, минимизация…

  • wikiruBERT

    …Как вы обрабатываете PII в данных для RAG (GDPR, 152-ФЗ)|263. Как вы обрабатываете PII в данных для RAG…

  • wikiFalse positives

    # False positives ## Определение Проблема при детекции PII, когда не-PII помечается как PII. ## Где встречается - [[275. Как вы делаете data…

  • wikiдеанонимизация

    # деанонимизация ## Определение Процесс обратного восстановления исходных персональных данных (PII) из маскированных, выполняемый с контролем доступа для соблюдения GDPR и 152…

  • answerКак вы делаете data quality monitoring для RAG корпуса?

    …Типы [[Вики/PII\|PII]] - Имена, фамилии - Номера телефонов - Email-адреса - Паспортные данные - Номера кредитных карт - IP-адреса Инструменты `[[Вики/Presidio…

  • wikipost-processing filter

    # post-processing filter ## Определение Фильтр, применяемый после генерации ответа модели для удаления конфиденциальных данных (PII) или выполнения других проверок. ## Где…

  • wikiФильтр на генерации

    # Фильтр на генерации ## Определение Проверка ответа LLM на утечку PII или вредоносный код перед выдачей пользователю; дополняет runtime detection. ## Где…

  • wikiEpsilon

    …Как происходит PII leakage через LLM и как защититься|885. Как происходит PII leakage через LLM и как защититься]] ## Навигация…

  • wikiPrompt-based guardrails

    …Как происходит PII leakage через LLM и как защититься|885. Как происходит PII leakage через LLM и как защититься]] ## Навигация…

  • wikiAzure Key Vault

    …Как вы обрабатываете PII в данных для RAG (GDPR, 152-ФЗ)|263. Как вы обрабатываете PII в данных для RAG…

  • wikiPost-processing filters

    …Как происходит PII leakage через LLM и как защититься|885. Как происходит PII leakage через LLM и как защититься]] ## Навигация…

  • wikiКонтекстная маскировка

    …Как вы обрабатываете PII в данных для RAG (GDPR, 152-ФЗ)|263. Как вы обрабатываете PII в данных для RAG…

  • answerКак вы логируете все вызовы LLM для аудита?

    …2000, "response_status": "success", "pii_masked": true, "version": "1.2" } ``` **Термин «[[Вики/маскировка\|маскировка]] [[Вики/PII\|PII]]» ([[Вики/PII\|Personally…

  • answerКак спроектировать систему, где LLM должна работать с конфиденциальными данными (медицина, финансы)?

    …Включает [[Вики/PHI\|PHI]] ([[Вики/PHI\|Protected Health Information]]) в медицине и [[Вики/PII\|PII]] ([[Вики/PII\|Personally Identifiable Information…