Удобное распознавание текста в Linux

Блог им. Sergei_T

Несмотря на то, что в Linux вполне себе существуют командные утилиты для распознавания текста (gocr, cuneiform, tesseract) мне нехватало удобного интерфейса чтобы хоть как-то заменить Fine Reader, пока не нашел GTK утилиту ocrfeeder.

Утиль позволяет самому размечать область распознавания (может и автоматически, но не очень хорошо это делает), распознавать несколько страниц, экспортировать в опенофисовский формат, в PDF и т.п.

Утилита сама находит поддерживаемые OCR движки, можно подправить аргументы командной строки (чтобы, например, выбрать язык), можно самому сделать несколько вариантов выбора OCR движков с разными параметрами.

—
28 мая 2013, 20:50
Sergei_T

Отличный и очень актуальный инструмент. Правда, пришлось повозиться со сборкой из исходников.

yababay

28 мая 2013, 23:33
↓

команды под русский язык бармы?

Sergei_T

29 мая 2013, 11:01
↑
↓

Только зарегистрированные и авторизованные пользователи могут оставлять комментарии.

Наверх

Удобное распознавание текста в Linux

Комментарии (2)

Похожие записи

Прямой эфир

Блоги