Self-contained chunk
Self-contained chunk
Определение
Self-contained chunk (самодостаточный чанк) — это фрагмент текста, который содержит всю необходимую информацию для понимания его содержания без обращения к другим частям документа. В контексте RAG-систем такие чанки создаются после разрешения кореферентных связей (coreference resolution), чтобы каждый сегмент был независимым и мог быть использован для поиска и генерации ответа. Это повышает точность извлечения информации и уменьшает риск потери контекста.