Распознавание текста в командной строке с помощью Tesseract

Конечно, применение системы распознавания текста Tesseract не заменит использование FineReader, но применение в скриптах, например, для индексации отсканированных документов может быть полезным.

Я устанавливал из репозитариев OpenSUSE.

Берем какой-нибудь отсканированный текст, например:

( Читать дальше )

Alfresco: распознавание изображений с помощью Tesseract

Отличная статья на тему:

tpeelen.wordpress.com/2010/12/17/alfresco-using-tesseract-ocr-on-ubuntu-linux/

Хорошо написано по добавлению собственных обработчиков файлов в Alfresco.