Camelot
Camelot
Определение
Библиотека Python для извлечения таблиц из PDF-документов. Поддерживает два режима: Lattice (для таблиц с видимыми линиями) и Stream (для таблиц без линий). Возвращает данные в виде pandas DataFrame.
Где встречается
- 114. Что такое Layout-Aware Chunking и как он связан с мультимодальностью
- 272. Как вы проверяете качество parsing документов (PDF, DOCX) в production
- 542. Как вы парсите сложные PDF с таблицами и графиками (не просто текст)
- 556. Как вы делаете extraction таблиц из PDF для RAG
- 800+ вопросов