sentence-transformers

Определение

Библиотека от Hugging Face для генерации плотных эмбеддингов предложений с помощью предобученных трансформеров. Широко применяется в self-hosted решениях для семантического поиска и кластеризации текстов.

Где встречается

13. Как вы загружаете 1000 документов в RAG максимально эффективно
15. Какие embedding-модели вы использовали и почему
18. Что такое Multi-vector retrieval и зачем он нужен
21. Когда вы выбираете fine-tuning вместо RAG, а когда — наоборот
35. Как вы fine-tune embedding модель под свой домен (а не используете готовую)
70. Как вы снижаете стоимость LLM в production на 50%+
74. Как вы мониторите дрейф данных (data drift) для RAG
77. Как вы оптимизируете embedding генерацию для большого количества документов
79. Как вы обновляете embedding модель без полной переиндексации
91. Что такое Semantic Caching и как вы его реализуете
104. Как вы интегрируете DSPy с RAG-пайплайном Приведите пример сигнатуры.
112. Как вы извлекаете логические отношения из диаграммы, а не просто текст
114. Что такое Layout-Aware Chunking и как он связан с мультимодальностью
119. Как вы комбинируете текстовый и визуальный поиск (early fusion vs late fusion)
123. Как вы защищаете RAG-систему от утечки данных между клиентами (multi-tenant isolation)
129. Как вы обнаруживаете многошаговые jailbreak-атаки (через 10-20 сообщений)
133. Альтернативы LLM-as-Judge — назовите 3 и их ограничения.
140. Как вы проверяете, что новая версия модели не сломала старые кейсы
173. Как вы оцениваете креативность LLM в production
192. Как вы оцениваете качество language representation для задачи
233. Как вы делаете hybrid search (vector + keyword) в production на 10M документов
235. Как вы выбираете ANN алгоритм под ваш use case (volume, dimensionality, budget)
243. Как вы делаете blue-green deployment для RAG системы с zero downtime
245. Как вы делаете cache invalidation для semantic cache при обновлении знаний
256. Как вы проектируете ETL пайплайн для 1M документовдень в RAG систему
264. Как вы делаете backfill эмбеддингов при смене embedding модели
266. Как вы делаете incremental ingestion для часто меняющихся документов
269. Как вы обрабатываете streaming данные для real-time RAG
285. Как вы анализируете embedding geometry для отладки retrieval качества
298. Как вы тестируете robustness LLM к adversarial input (не только injection)
352. Что такое jailbreak taxonomy (OOD, refusal suppression, role-play, перевод)
353. Как работает embedding poisoning для RAG и как защититься
356. Что такое data poisoning атака на fine-tuning и как защититься
371. Что такое LambdaMART и как он используется для reranking в RAG
373. Что такое learning-to-rank (LTR) и как он применяется к retrieval для LLM
374. Как вы делаете query rewriting и query expansion в RAG
376. Что такое hybrid search с весами (weighted hybrid) и как оптимизировать веса
378. Как работает многогранный (faceted) поиск в RAG с фильтрами
379. Как вы оцениваете retrieval с учетом позиции (Position-aware metrics)
380. Что такое semantic ranking на основе embeddings (вторая стадия после ANN)

sentence-transformers

sentence-transformers

Определение

Где встречается

Навигация

sentence-transformers

sentence-transformers

Определение

Где встречается

Навигация