中文翻译暂不可用,显示俄语原文。
pdfminer.six
pdfminer.six
Определение
Библиотека Python для извлечения текста и метаданных из PDF-документов. Является точным, но медленным инструментом, часто используется в пайплайнах парсинга, например, в Unstructured.io.
Где встречается
- 114. Что такое Layout-Aware Chunking и как он связан с мультимодальностью
- 272. Как вы проверяете качество parsing документов (PDF, DOCX) в production
- 527. Как вы проверяете качество парсинга документов (PDF, DOCX) в production