Document image analysis (DIA)
Document image analysis (DIA)
Определение
Document image analysis (DIA) — область на стыке компьютерного зрения и обработки естественного языка, занимающаяся автоматическим извлечением, распознаванием и структурированием информации из изображений документов (сканов, фотографий, PDF). Основные задачи DIA включают оптическое распознавание символов (OCR), понимание макета, выделение полей (например, даты, суммы, подписи) и классификацию типов документов. Современные подходы, такие как LayoutLMv3, решают задачи DIA целостно, объединяя текстовую, пространственную и визуальную модальности.