Length bias
Length bias
Определение
Length bias — это систематическое смещение в поведении языковых моделей, при котором они отдают предпочтение ответам определённой длины (более длинным или более коротким) вне зависимости от их содержательной ценности. Такое смещение может возникать на этапах обучения (например, при Teacher Forcing) или при использовании методов обратной связи (RLHF/RLAIF), где асессоры или модели-оценщики неявно поощряют определённую длину ответа.
Где встречается
- 933. Что такое Teacher Forcing при обучении декодера? В чем проблема Exposure Bias?
- 997. Что такое RLAIF (RL from AI Feedback)? Как масштабировать RLHF с помощью LLM-асессоров?