English translation is not available yet. Showing Russian content.

Tesseract OCR

Tesseract OCR

Определение

Инструмент оптического распознавания символов (OCR) для извлечения текста из сканов и изображений. Применяется в RAG-пайплайнах, но не сохраняет структуру диаграмм и графиков, что ограничивает его использование для сложных документов.

Где встречается

Навигация