Docling
Docling
Определение
Open-source библиотека от IBM Research для парсинга документов (PDF, Word, сканы) в структурированный Markdown с сохранением таблиц, формул и заголовков. Интегрируется с RAG-системами.
Где встречается
- 1. Как бы вы спроектировали RAG-систему для 10 000 документов с разной структурой
- 114. Что такое Layout-Aware Chunking и как он связан с мультимодальностью
- 272. Как вы проверяете качество parsing документов (PDF, DOCX) в production
- Практика