BAAI/bge-m3
BAAI/bge-m3
Определение
Мультиязычная эмбеддинг-модель от BAAI, поддерживающая 100+ языков и до 8192 токенов. Используется для retrieval в RAG-системах.
Где встречается
- 1. Как бы вы спроектировали RAG-систему для 10 000 документов с разной структурой
- 3 Какие стратегии chunking'а вы знаете и когда какую применяете
- 5. Как вы оцениваете качество retrieval'а в RAG-системе
- 6. Что такое гибридный поиск и когда он нужен
- 8. Как вы обрабатываете запросы, на которые нет ответа в документах
- 11. Что такое Hypothetical Document Embeddings (HyDE) и зачем
- 13. Как вы загружаете 1000 документов в RAG максимально эффективно
- 15. Какие embedding-модели вы использовали и почему
- 16. Как вы оцениваете качество генерации в RAG. Назовите 3 ключевые метрики.
- 18. Что такое Multi-vector retrieval и зачем он нужен
- 20. Как вы обеспечиваете, что RAG работает с документами на русском и английском одновременно
- 256. Как вы проектируете ETL пайплайн для 1M документовдень в RAG систему
- 862. Как делать feature engineering для RAG (кроме текста)
- Практика
- 800+ вопросов
- 299. RAG с мультиязычным поиском (русскийанглийскийкитайский)