Toxicity

Toxicity

Определение

Toxicity — метрика, оценивающая уровень оскорбительного, вредного или агрессивного контента в тексте. В production-системах автоматические детекторы (Perspective API, Llama Guard, OpenAI Moderation API) применяются к каждому сообщению для фильтрации нежелательных выходов модели.

Где встречается

    1. ...

Навигация