embedding-модель
embedding-модель
Определение
Модель машинного обучения, преобразующая текст в векторные представления (эмбеддинги). Используется в RAG для семантического поиска релевантных документов.
Где встречается
- 3 Какие стратегии chunking'а вы знаете и когда какую применяете
- 15. Какие embedding-модели вы использовали и почему
- 69. Как вы организуете CICD для RAG-пайплайна
- 74. Как вы мониторите дрейф данных (data drift) для RAG
- 79. Как вы обновляете embedding модель без полной переиндексации
- 81. Как бы вы спроектировали систему для 1000 одновременных пользователей чат-бота с RAG
- 91. Что такое Semantic Caching и как вы его реализуете
- 116. Как вы индексируете видео-контент в RAG-системе
- 123. Как вы защищаете RAG-систему от утечки данных между клиентами (multi-tenant isolation)
- 243. Как вы делаете blue-green deployment для RAG системы с zero downtime
- 257. Как вы дедуплицируете документы перед индексацией в RAG
- 410. Как вы делаете blue-green deployment для RAG системы с zero downtime
- 495. Что такое pairwise comparison vs scalar rating Когда что использовать
- 519. Как вы делаете backfill эмбеддингов при смене embedding модели
- 531. Как вы делаете active learning loop для улучшения retrieval
- 563. Как вы делаете image retrieval с фильтрацией по метаданным (дата, местоположение, камера)
- 611. Как работает adversarial example для embedding моделей (атака на retrieval)
- 651. Как работает attention математически Выведите формулу scaled dot-product attention.
- 672. Что такое residual connections и зачем они нужны в трансформере
- 683. Что такое data augmentation для LLM (back-translation, paraphrasing, masking)
- 750. Как устроена Memory в Harness (in-memory, fs, vector stores, relay)
- 851. Как строить streaming RAG pipeline (real-time ingestion)
- 800+ вопросов
- 33. Реализовать write-through cache для RAG
- 42. Настроить hybrid search с весами
- 91. Написать postmortem для retrieval degradation
- 236. RAG с оценкой faithfulness
- 269. Реализовать hard negative mining для retrieval
- 298. Fine-tune embedding для юридического домена