Backdoor attack

Backdoor attack

Определение

Backdoor attack (атака с бэкдором) — это вид атаки на модели машинного обучения, при которой злоумышленник внедряет скрытые триггеры в обучающие данные. Такие триггеры активируют нежелательное поведение модели только при наличии определённого паттерна (например, пиксельного шума или слова), в остальных случаях модель работает нормально. Атака сложна для обнаружения, так как поведение модели на обычных данных остаётся неизменным.

Где встречается

Навигация