NaN
NaN
Определение
Значение Not a Number, возникающее в loss или градиентах и указывающее на численную нестабильность при обучении модели; часто решается уменьшением learning rate или gradient clipping.
Где встречается
- 34. Какая у вас была самая сложная проблема при fine-tuning и как вы её решили
- 800+ вопросов
- 60. Настроить гибрид (Mamba + Attention)