PromptBenchPromptBench Определение Бенчмарк для оценки устойчивости LLM к adversarial промптам, включая jailbreak-атаки. Где встречается 497. Как вы проектируете red teaming evaluation для jailbreak устойчивости Навигация Индекс терминов Индекс разборов Оглавление
PromptBench Определение Бенчмарк для оценки устойчивости LLM к adversarial промптам, включая jailbreak-атаки. Где встречается 497. Как вы проектируете red teaming evaluation для jailbreak устойчивости Навигация Индекс терминов Индекс разборов Оглавление