generalization
generalization
Определение
Обобщающая способность модели — способность правильно отвечать на новые, невиданные данные, включая парафразы запросов. Связана с формой loss landscape (sharp vs flat minima).
Где встречается
- 296. Как работает извлечение знаний (knowledge editing) из LLM без переобучения
- 669. Как работает связь между SGD и Adam Почему Adam лучше для LLM
- 690. Как вы измеряете diversity синтетического датасета
- 800+ вопросов