Document VQA
Document VQA
Определение
Document VQA (Visual Question Answering on Documents) — задача, в которой модель отвечает на вопросы по изображению документа, используя текст, его пространственное расположение и визуальные признаки. В отличие от обычного VQA, здесь требуется понимание структуры документа (таблицы, формы, расположение абзацев). Это актуально для автоматизации обработки счетов, анкет, контрактов и других документов.