中文翻译暂不可用,显示俄语原文。
sentence-transformers
sentence-transformers
Определение
Библиотека от Hugging Face для генерации плотных эмбеддингов предложений с помощью предобученных трансформеров. Широко применяется в self-hosted решениях для семантического поиска и кластеризации текстов.
Где встречается
- 13. Как вы загружаете 1000 документов в RAG максимально эффективно
- 15. Какие embedding-модели вы использовали и почему
- 18. Что такое Multi-vector retrieval и зачем он нужен
- 21. Когда вы выбираете fine-tuning вместо RAG, а когда — наоборот
- 35. Как вы fine-tune embedding модель под свой домен (а не используете готовую)
- 70. Как вы снижаете стоимость LLM в production на 50%+
- 74. Как вы мониторите дрейф данных (data drift) для RAG
- 77. Как вы оптимизируете embedding генерацию для большого количества документов
- 79. Как вы обновляете embedding модель без полной переиндексации
- 91. Что такое Semantic Caching и как вы его реализуете
- 104. Как вы интегрируете DSPy с RAG-пайплайном Приведите пример сигнатуры.
- 112. Как вы извлекаете логические отношения из диаграммы, а не просто текст
- 114. Что такое Layout-Aware Chunking и как он связан с мультимодальностью
- 119. Как вы комбинируете текстовый и визуальный поиск (early fusion vs late fusion)
- 123. Как вы защищаете RAG-систему от утечки данных между клиентами (multi-tenant isolation)
- 129. Как вы обнаруживаете многошаговые jailbreak-атаки (через 10-20 сообщений)
- 133. Альтернативы LLM-as-Judge — назовите 3 и их ограничения.
- 140. Как вы проверяете, что новая версия модели не сломала старые кейсы
- 173. Как вы оцениваете креативность LLM в production
- 192. Как вы оцениваете качество language representation для задачи
- 233. Как вы делаете hybrid search (vector + keyword) в production на 10M документов
- 235. Как вы выбираете ANN алгоритм под ваш use case (volume, dimensionality, budget)
- 243. Как вы делаете blue-green deployment для RAG системы с zero downtime
- 245. Как вы делаете cache invalidation для semantic cache при обновлении знаний
- 256. Как вы проектируете ETL пайплайн для 1M документовдень в RAG систему
- 264. Как вы делаете backfill эмбеддингов при смене embedding модели
- 266. Как вы делаете incremental ingestion для часто меняющихся документов
- 269. Как вы обрабатываете streaming данные для real-time RAG
- 285. Как вы анализируете embedding geometry для отладки retrieval качества
- 298. Как вы тестируете robustness LLM к adversarial input (не только injection)
- 352. Что такое jailbreak taxonomy (OOD, refusal suppression, role-play, перевод)
- 353. Как работает embedding poisoning для RAG и как защититься
- 356. Что такое data poisoning атака на fine-tuning и как защититься
- 371. Что такое LambdaMART и как он используется для reranking в RAG
- 373. Что такое learning-to-rank (LTR) и как он применяется к retrieval для LLM
- 374. Как вы делаете query rewriting и query expansion в RAG
- 376. Что такое hybrid search с весами (weighted hybrid) и как оптимизировать веса
- 378. Как работает многогранный (faceted) поиск в RAG с фильтрами
- 379. Как вы оцениваете retrieval с учетом позиции (Position-aware metrics)
- 380. Что такое semantic ranking на основе embeddings (вторая стадия после ANN)