Unstructured

Unstructured

Определение

Библиотека для парсинга неструктурированных документов (PDF, Word, изображения и др.) с поддержкой layout detection, OCR и chunking. Используется в RAG-пайплайнах для извлечения текста из сложных форматов.

Где встречается

Навигация