LayoutLM

LayoutLM

Определение

LayoutLM — семейство предобученных моделей от Microsoft, предназначенных для понимания документов с визуальной разметкой. Модели объединяют текстовую, визуальную (изображение документа) и позиционную (координаты токенов на странице) информацию, что позволяет эффективно обрабатывать сложные документы, такие как PDF с таблицами и колонками. LayoutLMv2 и LayoutLMv3 расширяют оригинальную архитектуру, добавляя двунаправленное внимание к визуальным и текстовым модальностям.

Где встречается

Навигация