CLARE
CLARE
Определение
CLARE — фразовая атака на LLM, заменяющая или вставляющая целые фразы с сохранением смысла, используется для тестирования robustness к adversarial input.
CLARE — фразовая атака на LLM, заменяющая или вставляющая целые фразы с сохранением смысла, используется для тестирования robustness к adversarial input.