中文翻译暂不可用,显示俄语原文。
Overfitting
Overfitting
Определение
Переобучение модели, при котором она запоминает особенности обучающего набора вместо обобщения, что ухудшает качество на новых данных.
Где встречается
- 21. Когда вы выбираете fine-tuning вместо RAG, а когда — наоборот
- 24. Какой размер датасета нужен для fine-tuning
- 25. Как вы оцениваете качество после fine-tuning
- 28. Какие данные нужны для fine-tuning на кастомный стиль общения
- 34. Какая у вас была самая сложная проблема при fine-tuning и как вы её решили
- 35. Как вы fine-tune embedding модель под свой домен (а не используете готовую)
- 106. Как вы валидируете, что DSPy-оптимизация действительно улучшила модель, а не просто переобучилась под метрику
- 329. Как обучается reward model для RLHF и как избегать reward hacking
- 494. Что такое synthetic eval collapse и как его предотвратить
- 514. Как вы генерируете synthetic данные для instruction tuning
- 531. Как вы делаете active learning loop для улучшения retrieval
- 602. Как работает membership inference атака на LLM
- 622. Как работает membership inference через logits (разница в вероятностях)
- 669. Как работает связь между SGD и Adam Почему Adam лучше для LLM
- 675. Как работает dropout и зачем он нужен в LLM (regularization)
- 683. Что такое data augmentation для LLM (back-translation, paraphrasing, masking)
- 690. Как вы измеряете diversity синтетического датасета
- 693. Как вы обнаруживаете contamination (пересечение synthetic данных с тестовыми)
- 700. Как вы комбинируете реальные и синтетические данные для максимального качества
- 862. Как делать feature engineering для RAG (кроме текста)
- 800+ вопросов
- 95. Написать runbook для synthetic data collapse
- 273. Реализовать curriculum learning