Toxicity
Toxicity
Определение
Toxicity — метрика, оценивающая уровень оскорбительного, вредного или агрессивного контента в тексте. В production-системах автоматические детекторы (Perspective API, Llama Guard, OpenAI Moderation API) применяются к каждому сообщению для фильтрации нежелательных выходов модели.
Где встречается
-
- ...