English translation is not available yet. Showing Russian content.
adversarial input
adversarial input
Определение
Специально модифицированные входные данные (промпты, изображения и т.д.), которые вызывают ошибочный вывод модели; используются для тестирования робастности и red teaming.
Где встречается
- 153. Что такое ∇-Reasoner (nabla-reasoner) и как он использует градиентный спуск на этапе теста
- 298. Как вы тестируете robustness LLM к adversarial input (не только injection)
- 345. Как вы проектируете red teaming evaluation для jailbreak устойчивости
- 355. Как вы защищаете LLM от градиентных атак (white-box jailbreak)
- 497. Как вы проектируете red teaming evaluation для jailbreak устойчивости
- 596. Как работает model stealing attack (экстракция модели через API)
- 611. Как работает adversarial example для embedding моделей (атака на retrieval)
- 616. Как работает rainbow teaming (комбинация red + blue + purple teaming для LLM)
- 625. Что такое adversarial prompt detection для реального времени (runtime)
- 732. Что такое EU AI Act и как оно влияет на деплой LLM в production
- 866. Как генерировать synthetic датасеты для RAG evaluation
- 868. Что такое red teaming для LLM и как его проводить
- 883. Как защитить RAG от poisoning (вредоносные документы в базе знаний)
- 889. Как детектировать и предотвращать vector DB poisoning
- 890. Как тестировать robustness LLM к adversarial inputs
- 800+ вопросов
- 152. Реализовать test generation для агента