RecursiveCharacterTextSplitter
RecursiveCharacterTextSplitter
Определение
Инструмент из LangChain для рекурсивного разбиения текста по разделителям (абзацы, предложения, слова), дефолтный выбор для большинства текстов при чанковании.
Где встречается
- 1. Как бы вы спроектировали RAG-систему для 10 000 документов с разной структурой
- 3 Какие стратегии chunking'а вы знаете и когда какую применяете
- 71. Как вы тестируете RAG-систему на новых документах без реальных пользователей
- 114. Что такое Layout-Aware Chunking и как он связан с мультимодальностью
- 256. Как вы проектируете ETL пайплайн для 1M документовдень в RAG систему
- 285. Как вы анализируете embedding geometry для отладки retrieval качества
- 428. Как вы проектируете Kafka топологии для RAG ingestion
- 636. Как вы проектируете промпт для long context рассуждения (CoT, ToT, GoT)
- 645. Что такое hierarchical retrieval для long context RAG (когда контекст 100k)
- 855. Как проектировать CDC (Change Data Capture) для документов
- 858. Как проектировать ETL vs ELT для RAG
- 863. Как проектировать Airflow DAG для RAG ingestion
- 800+ вопросов
- 50. Настроить contextual retrieval (Anthropic стиль)
- 88. Реализовать hallucination indicator
- 227. RAG с гибридным поиском
- 245. RAG с semantic chunking
- 266. Сгенерировать synthetic датасет для RAG