English translation is not available yet. Showing Russian content.

Adversarial attacks

Adversarial attacks

Определение

Попытки обойти защиту модели через вредоносные запросы, против которых применяются методы вроде Constitutional AI.

Где встречается

Навигация