pre-training

pre-training

Определение

Pre-training (предобучение) — начальный этап обучения модели с нуля на большом корпусе данных с использованием кросс-энтропии. Для LLM типичны batch size 512–4096 и learning rate 1e-4–3e-4.

Где встречается

Навигация