Распознавание текста в командной строке с помощью Tesseract

Блог им. Sergei_T

Конечно, применение системы распознавания текста Tesseract не заменит использование FineReader, но применение в скриптах, например, для индексации отсканированных документов может быть полезным.

Я устанавливал из репозитариев OpenSUSE.

Берем какой-нибудь отсканированный текст, например:

( Читать дальше )

OCR,
Tesseract

—
26 января 2012, 23:13
Sergei_T
1

Alfresco: распознавание изображений с помощью Tesseract

Блог им. Sergei_T

Отличная статья на тему:

tpeelen.wordpress.com/2010/12/17/alfresco-using-tesseract-ocr-on-ubuntu-linux/

Хорошо написано по добавлению собственных обработчиков файлов в Alfresco.

—
26 января 2012, 22:51
Sergei_T
комментировать

Распознавание текста в командной строке с помощью Tesseract

Alfresco: распознавание изображений с помощью Tesseract

Прямой эфир