adversarial training

adversarial training

Определение

Метод повышения устойчивости модели к атакам путём включения состязательных примеров (adversarial examples) в обучающую выборку. Используется для защиты от jailbreak и других атак.

Где встречается

Навигация