Tabula
Tabula
Определение
Java-утилита и rule-based библиотека для извлечения таблиц из текстовых PDF с чёткими линиями, возвращающая структуру в pandas DataFrame.
Где встречается
- 542. Как вы парсите сложные PDF с таблицами и графиками (не просто текст)
- 556. Как вы делаете extraction таблиц из PDF для RAG
- 800+ вопросов