Contents
Questions
Practice
Wiki
Community materials
Tests
Search

✈Telegram @ai_varo

…

Contents/Wiki/Overfitting

English translation is not available yet. Showing Russian content.

Overfitting

Overfitting

Определение

Переобучение модели, при котором она запоминает особенности обучающего набора вместо обобщения, что ухудшает качество на новых данных.

Где встречается

21. Когда вы выбираете fine-tuning вместо RAG, а когда — наоборот
24. Какой размер датасета нужен для fine-tuning
25. Как вы оцениваете качество после fine-tuning
28. Какие данные нужны для fine-tuning на кастомный стиль общения
34. Какая у вас была самая сложная проблема при fine-tuning и как вы её решили
35. Как вы fine-tune embedding модель под свой домен (а не используете готовую)
106. Как вы валидируете, что DSPy-оптимизация действительно улучшила модель, а не просто переобучилась под метрику
329. Как обучается reward model для RLHF и как избегать reward hacking
494. Что такое synthetic eval collapse и как его предотвратить
514. Как вы генерируете synthetic данные для instruction tuning
531. Как вы делаете active learning loop для улучшения retrieval
602. Как работает membership inference атака на LLM
622. Как работает membership inference через logits (разница в вероятностях)
669. Как работает связь между SGD и Adam Почему Adam лучше для LLM
675. Как работает dropout и зачем он нужен в LLM (regularization)
683. Что такое data augmentation для LLM (back-translation, paraphrasing, masking)
690. Как вы измеряете diversity синтетического датасета
693. Как вы обнаруживаете contamination (пересечение synthetic данных с тестовыми)
700. Как вы комбинируете реальные и синтетические данные для максимального качества
862. Как делать feature engineering для RAG (кроме текста)
800+ вопросов
95. Написать runbook для synthetic data collapse
273. Реализовать curriculum learning

Навигация

Индекс терминов
Индекс разборов
Оглавление