LlamaIndex
LlamaIndex
Определение
Фреймворк для индексации и поиска данных с LLM, обеспечивающий сложные RAG-пайплайны и стратегии retrieval.
Где встречается
- 2 Как вы решаете проблему lost in the middle при работе с длинными контекстами
- 38. Как вы fine-tune модель для функции вызов внешнего API
- 41. LangChain vs LlamaIndex vs Haystack — что выберете и почему
- 69. Как вы организуете CICD для RAG-пайплайна
- 80. Какие 3 книгикурса вы рекомендуете по production LLM
- 83. Как спроектировать систему, где LLM должна работать с конфиденциальными данными (медицина, финансы)
- 101. Что такое DSPy и какую проблему он решает, которую не решают LangChain или LlamaIndex
- 112. Как вы извлекаете логические отношения из диаграммы, а не просто текст
- 115. Как вы обрабатываете большие таблицы в RAG (500+ строк)
- 119. Как вы комбинируете текстовый и визуальный поиск (early fusion vs late fusion)
- 143. Как вы боретесь с «бесконечным циклом» агента в Agentic RAG
- 189. Как вы проектируете language representation для сложной задачи
- 196. Как language representation связан с тест-тайм компьютингом
- 199. Как вы combine language representation с DSPy
- 255. Как вы управляете секретами (API keys для LLM) в Kubernetes
- 264. Как вы делаете backfill эмбеддингов при смене embedding модели
- 377. Как вы делаете retrieval для структурированных данных (SQL, Knowledge Graph)
- 529. Как вы проектируете feature engineering для контекста RAG (кроме текста)
- 556. Как вы делаете extraction таблиц из PDF для RAG
- 558. Как вы делаете video summarization для RAG (вход — длинное видео, выход — краткое описание)
- 559. Что такое Audio RAG (RAG для аудиофайлов)
- 612. Что такое data exfiltration через LLM (утечка данных через ответы)
- 631. Как вы делаете длинный контекст для RAG (100k+ токенов в контексте)
- 686. Как работает synthetic data для RLHF (предпочтения)
- 697. Как вы масштабируете синтетическую генерацию до миллионов примеров (cost optimization)
- 699. Как вы оцениваете, сколько синтетических данных нужно для fine-tuning (power analysis)
- 700. Как вы комбинируете реальные и синтетические данные для максимального качества
- 741. Что такое Partial Harnessing (частичное управление)
- 757. Какие инструменты и фреймворки существуют для Harness Engineering
- 800+ вопросов
- 17. Настроить S3 consistency для RAG
- 80. Реализовать cost attribution per feature
- 197. Реализовать graceful degradation при отказе vector DB
- 249. RAG с cost-aware routing
- 254. Реализовать SLO для RAG
- 255. Настроить correlation метрик