Оглавление
Вопросы
Практика
Вики
Материалы сообщества
Тесты
Поиск

✈Telegram @ai_varo

…

Оглавление/Вики/embedding

embedding

embedding

Определение

Преобразование chunk'ов в векторные представления для поиска в векторной БД.

Где встречается

1. Как бы вы спроектировали RAG-систему для 10 000 документов с разной структурой
5. Как вы оцениваете качество retrieval'а в RAG-системе
6. Что такое гибридный поиск и когда он нужен
13. Как вы загружаете 1000 документов в RAG максимально эффективно
16. Как вы оцениваете качество генерации в RAG. Назовите 3 ключевые метрики.
21. Когда вы выбираете fine-tuning вместо RAG, а когда — наоборот
28. Какие данные нужны для fine-tuning на кастомный стиль общения
35. Как вы fine-tune embedding модель под свой домен (а не используете готовую)
50. Как вы ограничиваете бесконечный цикл агента
62. Какие метрики вы мониторите для LLM в production
71. Как вы тестируете RAG-систему на новых документах без реальных пользователей
77. Как вы оптимизируете embedding генерацию для большого количества документов
78. Какие LLM для русского языка вы используете
80. Какие 3 книгикурса вы рекомендуете по production LLM
86. Как вы решаете проблему “я знаю, что ответ есть в документах, но retrieval не находит”
104. Как вы интегрируете DSPy с RAG-пайплайном Приведите пример сигнатуры.
112. Как вы извлекаете логические отношения из диаграммы, а не просто текст
114. Что такое Layout-Aware Chunking и как он связан с мультимодальностью
117. Какие embedding-модели для мультимодального поиска вы используете CLIP, BLIP-2, ImageBind
128. Что такое Model Poisoning в контексте RAG и как защититься
133. Альтернативы LLM-as-Judge — назовите 3 и их ограничения.
141. В чем разница между Naive RAG, Adaptive RAG и Agentic RAG
144. Как вы передаете состояние (state) между шагами агента
151. Что такое тест-тайм компьютинг (Test-Time Compute) и чем он отличается от обычного инференса
153. Что такое ∇-Reasoner (nabla-reasoner) и как он использует градиентный спуск на этапе теста
156. Как вы выбираете между увеличением тест-тайм компьютинга и использованием большей модели
177. Как вы измеряете дрейф модели (model drift) для LLM
178. Чем отличается эвалюация LLM от эвалюации традиционных ML моделей
182. Что такое «схема» (schema) в контексте LLM и как она связана с языковым представлением
186. Что такое «shaping schema through language representation»
187. Как язык промпта (русский vs английский) влияет на схему рассуждения
192. Как вы оцениваете качество language representation для задачи
198. Какие ограничения у language representation design
199. Как вы combine language representation с DSPy
200. Что вы видите следующим горизонтом после language representation
241. Как вы делаете distributed tracing для цепочки user → gateway → RAG → LLM → user
245. Как вы делаете cache invalidation для semantic cache при обновлении знаний
251. Как вы деплоите LLM на spot instances в облаке
256. Как вы проектируете ETL пайплайн для 1M документовдень в RAG систему
257. Как вы дедуплицируете документы перед индексацией в RAG

Навигация

Индекс терминов
Индекс разборов
Оглавление