Оглавление
Вопросы
Практика
Вики
Материалы сообщества
Тесты
Поиск

✈Telegram @ai_varo

…

Оглавление/Вики/Early Stopping

Early Stopping

Early Stopping

Определение

Техника остановки обучения при ухудшении метрик на валидации для предотвращения переобучения; также применяется в инференсе для досрочного завершения генерации при достижении порога уверенности.

Где встречается

25. Как вы оцениваете качество после fine-tuning
26. Как вы предотвращаете catastrophic forgetting при fine-tuning
34. Какая у вас была самая сложная проблема при fine-tuning и как вы её решили
35. Как вы fine-tune embedding модель под свой домен (а не используете готовую)
37. Как вы избегаете переобучения при fine-tuning на маленьком датасете
47. Что такое ReAct Agent и как он работает
165. Как тест-тайм компьютинг меняет MLOps
337. Как вы проверяете, что RLHF не сломал базовые способности модели
393. Как вы измеряете «cost of reasoning» у агента (не только токены, но и шаги, время, ошибки)
583. Как вы делаете agent с bounded rationality (ограниченные вычислительные ресурсы)
602. Как работает membership inference атака на LLM
622. Как работает membership inference через logits (разница в вероятностях)
638. Как работает ∇-Reasoner (градиентный спуск в пространстве токенов на этапе теста)
699. Как вы оцениваете, сколько синтетических данных нужно для fine-tuning (power analysis)
700. Как вы комбинируете реальные и синтетические данные для максимального качества
876. Как избежать evaluation overfitting (когда модель учится на тесте)
Практика
800+ вопросов
45. Реализовать learning-to-rank с LambdaMART
63. Реализовать verifier-guided decoding
65. Реализовать process reward model
69. Реализовать deliberate decoding
80. Реализовать cost attribution per feature
95. Написать runbook для synthetic data collapse
223. Fine-tune LoRA для стиля
229. Fine-tune embedding под домен
235. LoRA для function calling
298. Fine-tune embedding для юридического домена

Навигация

Индекс терминов
Индекс разборов
Оглавление