English translation is not available yet. Showing Russian content.
Overfitting
Overfitting
Определение
Переобучение модели, при котором она запоминает особенности обучающего набора вместо обобщения, что ухудшает качество на новых данных.
Где встречается
- 21. Когда вы выбираете fine-tuning вместо RAG, а когда — наоборот
- 24. Какой размер датасета нужен для fine-tuning
- 25. Как вы оцениваете качество после fine-tuning
- 28. Какие данные нужны для fine-tuning на кастомный стиль общения
- 34. Какая у вас была самая сложная проблема при fine-tuning и как вы её решили
- 35. Как вы fine-tune embedding модель под свой домен (а не используете готовую)
- 106. Как вы валидируете, что DSPy-оптимизация действительно улучшила модель, а не просто переобучилась под метрику
- 329. Как обучается reward model для RLHF и как избегать reward hacking
- 494. Что такое synthetic eval collapse и как его предотвратить
- 514. Как вы генерируете synthetic данные для instruction tuning
- 531. Как вы делаете active learning loop для улучшения retrieval
- 602. Как работает membership inference атака на LLM
- 622. Как работает membership inference через logits (разница в вероятностях)
- 669. Как работает связь между SGD и Adam Почему Adam лучше для LLM
- 675. Как работает dropout и зачем он нужен в LLM (regularization)
- 683. Что такое data augmentation для LLM (back-translation, paraphrasing, masking)
- 690. Как вы измеряете diversity синтетического датасета
- 693. Как вы обнаруживаете contamination (пересечение synthetic данных с тестовыми)
- 700. Как вы комбинируете реальные и синтетические данные для максимального качества
- 862. Как делать feature engineering для RAG (кроме текста)
- 800+ вопросов
- 95. Написать runbook для synthetic data collapse
- 273. Реализовать curriculum learning