Certified robustness
Certified robustness
Определение
Математические гарантии устойчивости модели к возмущениям в заданном радиусе; например, Randomized Smoothing.
Где встречается
- 298. Как вы тестируете robustness LLM к adversarial input (не только injection)
- 355. Как вы защищаете LLM от градиентных атак (white-box jailbreak)
- 611. Как работает adversarial example для embedding моделей (атака на retrieval)