replay buffer
replay buffer
Определение
Метод, при котором оригинальные данные смешиваются с новыми во время fine-tuning или обучения, чтобы предотвратить катастрофическое забывание и сохранить старые знания.
Где встречается
- 26. Как вы предотвращаете catastrophic forgetting при fine-tuning
- 311. Что такое CUDA graphs и как они ускоряют LLM инференс
- 391. Как вы проектируете агента, который может работать непрерывно (247) без дрейфа поведения
- 400. Как вы проектируете систему для continuous learning LLM-агента в production — чтобы агент улучшался от взаимодействий с пользователями без переобучения на шум и без катастрофиче...
- 800+ вопросов