repetition penalty

repetition penalty

Определение

Техника LLM inference, при которой логит уже сгенерированного токена делится на коэффициент больше 1 на каждом шаге, снижая вероятность повторений и зацикливания.

Где встречается

Навигация