English translation is not available yet. Showing Russian content.

CLARE

CLARE

Определение

CLARE — фразовая атака на LLM, заменяющая или вставляющая целые фразы с сохранением смысла, используется для тестирования robustness к adversarial input.

Где встречается

Навигация