Early Stopping
Early Stopping
Определение
Техника остановки обучения при ухудшении метрик на валидации для предотвращения переобучения; также применяется в инференсе для досрочного завершения генерации при достижении порога уверенности.
Где встречается
- 25. Как вы оцениваете качество после fine-tuning
- 26. Как вы предотвращаете catastrophic forgetting при fine-tuning
- 34. Какая у вас была самая сложная проблема при fine-tuning и как вы её решили
- 35. Как вы fine-tune embedding модель под свой домен (а не используете готовую)
- 37. Как вы избегаете переобучения при fine-tuning на маленьком датасете
- 47. Что такое ReAct Agent и как он работает
- 165. Как тест-тайм компьютинг меняет MLOps
- 337. Как вы проверяете, что RLHF не сломал базовые способности модели
- 393. Как вы измеряете «cost of reasoning» у агента (не только токены, но и шаги, время, ошибки)
- 583. Как вы делаете agent с bounded rationality (ограниченные вычислительные ресурсы)
- 602. Как работает membership inference атака на LLM
- 622. Как работает membership inference через logits (разница в вероятностях)
- 638. Как работает ∇-Reasoner (градиентный спуск в пространстве токенов на этапе теста)
- 699. Как вы оцениваете, сколько синтетических данных нужно для fine-tuning (power analysis)
- 700. Как вы комбинируете реальные и синтетические данные для максимального качества
- 876. Как избежать evaluation overfitting (когда модель учится на тесте)
- Практика
- 800+ вопросов
- 45. Реализовать learning-to-rank с LambdaMART
- 63. Реализовать verifier-guided decoding
- 65. Реализовать process reward model
- 69. Реализовать deliberate decoding
- 80. Реализовать cost attribution per feature
- 95. Написать runbook для synthetic data collapse
- 223. Fine-tune LoRA для стиля
- 229. Fine-tune embedding под домен
- 235. LoRA для function calling
- 298. Fine-tune embedding для юридического домена