Document VQA (DocVQA)
Document VQA (DocVQA)
Определение
Document VQA (DocVQA) — задача понимания документов, в которой модель отвечает на вопросы, опираясь на содержимое и структуру документа (текст, разметку, изображения). В отличие от классического VQA, DocVQA требует учёта пространственного расположения элементов (поля, таблицы, заголовки) и часто выполняется по отсканированным или цифровым документам.