NER
NER
Определение
Метод обнаружения и маскировки PII (персональных данных) в тексте перед индексацией, часто реализуемый моделями spaCy, DeBERTa-NER или Presidio.
Где встречается
- 28. Какие данные нужны для fine-tuning на кастомный стиль общения
- 83. Как спроектировать систему, где LLM должна работать с конфиденциальными данными (медицина, финансы)
- 263. Как вы обрабатываете PII в данных для RAG (GDPR, 152-ФЗ)
- 518. Как вы обрабатываете PII в данных для RAG (GDPR, 152-ФЗ)
- 523. Как вы делаете synthetic data generation для редких классов в датасете
- 530. Как вы делаете data quality monitoring для RAG корпуса
- 612. Что такое data exfiltration через LLM (утечка данных через ответы)
- 624. Как вы защищаете RAG от data poisoning через неявные инструкции (subtle injections)
- 694. Как работает weak supervision для synthetic данных (создание правил разметки)
- 862. Как делать feature engineering для RAG (кроме текста)
- 885. Как происходит PII leakage через LLM и как защититься
- 800+ вопросов
- 84. Реализовать conversational repair
- 281. Настроить мониторинг дрейфа метрик