English translation is not available yet. Showing Russian content.
CLARE
CLARE
Определение
CLARE — фразовая атака на LLM, заменяющая или вставляющая целые фразы с сохранением смысла, используется для тестирования robustness к adversarial input.
English translation is not available yet. Showing Russian content.
CLARE — фразовая атака на LLM, заменяющая или вставляющая целые фразы с сохранением смысла, используется для тестирования robustness к adversarial input.