English translation is not available yet. Showing Russian content.
adversarial examples
adversarial examples
Определение
Специально сконструированные входные данные, вызывающие ошибочное поведение LLM, используемые для тестирования robustness и безопасности.
Где встречается
- 106. Как вы валидируете, что DSPy-оптимизация действительно улучшила модель, а не просто переобучилась под метрику
- 126. Что такое MITRE ATLAS и как он связан с MITRE ATT&CK
- 288. Как вы тестируете видение модели (vision-language) на пропущенные детали
- 341. Как вы проектируете бенчмарк для нового домена (медицина, юриспруденция)
- 352. Что такое jailbreak taxonomy (OOD, refusal suppression, role-play, перевод)
- 494. Что такое synthetic eval collapse и как его предотвратить
- 598. Как работает embedding poisoning для RAG и как защититься
- 800+ вопросов