Adversarial Instructions
Adversarial Instructions
Определение
Инструкции с противоречиями, шумом или неявными отсылками для проверки способности модели следовать сложным инструкциям и её робастности.
Инструкции с противоречиями, шумом или неявными отсылками для проверки способности модели следовать сложным инструкциям и её робастности.