English translation is not available yet. Showing Russian content.
ensemble adversarial training
ensemble adversarial training
Определение
Метод защиты LLM от градиентных атак, при котором модель обучается на атаках, сгенерированных несколькими различными моделями, для повышения устойчивости.