中文翻译暂不可用,显示俄语原文。
White-box
White-box
Определение
Сценарий атаки или тестирования, при котором атакующий имеет полный доступ к архитектуре, весам и градиентам модели. Позволяет проводить градиентные атаки, такие как FGSM.
Где встречается
- 127. Как вы проводите red teaming LLM-приложения Назовите 3 техники.
- 622. Как работает membership inference через logits (разница в вероятностях)
- 736. Что такое red teaming certification (стандарты 2026 для оценки robustness)
- 800+ вопросов