BBQ
BBQ
Определение
Бенчмарк для измерения стереотипов и предвзятости в языковых моделях, используется для оценки bias amplification после RLAIF.
Где встречается
- 330. Что такое RLAIF (RL from AI Feedback) и как он масштабируется
- 331. Как вы измеряете quality RLHF модели вне стандартных бенчмарков (MT-Bench)