Black-box attack
Black-box attack
Определение
Атака без знания архитектуры модели, основанная на эволюционных алгоритмах или аппроксимациях по выходам API.
Где встречается
- 298. Как вы тестируете robustness LLM к adversarial input (не только injection)
- 611. Как работает adversarial example для embedding моделей (атака на retrieval)
- 622. Как работает membership inference через logits (разница в вероятностях)
- 736. Что такое red teaming certification (стандарты 2026 для оценки robustness)
- 800+ вопросов