OpenKM: Knowledge Management

OpenKM — открытая ECM система (читай — для управления контентом и документооборота) под GPL v2. Работает на таких близких сердцу технологиях, как JBoss, GWT, Lucene, OpenOffice. Есть даже возможность сканирования документов прямо из браузера.



Онлайн демо:

demo.openkm.com/OpenKM/frontend/index.jsp

Китайский интернет магазин eForChina

Сегодня получил посылку с интернет магазина www.eforchina.com. Опишу свои впечатления. Оплачивал с помощью PayPal, посылка шла почти месяц. Доставка бесплатная, дольше всего посылка идет по России.



Коробка пришла немного помятой, но все содержимое цело. На таможенной декларации написано «подарок»:

( Читать дальше )

Wordpress CMIS плагин

Интересный плагин для WordPress для интеграции файловых хранилищ (тот же Alfresco) через CMIS, в итоге получаем листинг хранилища вида:

Распознавание текста в командной строке с помощью Tesseract

Конечно, применение системы распознавания текста Tesseract не заменит использование FineReader, но применение в скриптах, например, для индексации отсканированных документов может быть полезным.

Я устанавливал из репозитариев OpenSUSE.

Берем какой-нибудь отсканированный текст, например:

( Читать дальше )

Alfresco: распознавание изображений с помощью Tesseract

Отличная статья на тему:

tpeelen.wordpress.com/2010/12/17/alfresco-using-tesseract-ocr-on-ubuntu-linux/

Хорошо написано по добавлению собственных обработчиков файлов в Alfresco.

Пятничная встреча пользователей!

Завтра, Т.К. 19-30 (предлагаем варианты)

В программе:
Интересное общение
Раздача сигар

Bash: проверяем тип файла

Проверить тип файла можно с помощью команды file, например, вывести mime-тип файла можно так (естественно, определение идет по содержимому файла):

file -i файл.doc
файл.doc: application/msword; charset=binary


На bash можно сделать такую конструкцию — если тип файла (имя передается параметром скрипту) соответствует определенным типам, то производим с файлом какие-либо действия:

type=$(file -i "$1")
if echo "$type" | egrep -q 'office|word'
then
  # Делаем что-нибудь
fi

Alfresco 4.0c: замена OpenOffice на LibreOffice

В целом OpenOffice 3.2, поставляемый в комплекте с Alfresco 4.0c не слишком хорош. При обработке docx документов падает. Замена на LibreOffice 3.4.5 помогла.

Также в LibreOffice уже есть встроенный headless режим, т.е. никаких ухищрений не нужно.

Для установки необходимо просто скачать архив с rpm-никами с официального сайта (Я использую CentOS 5).

Устанавливаем rpm-ки командой:

( Читать дальше )

Alfresco: прием контента в письмах

Отличная статья по настройке приема писем Alfresco. Можно настроить так, чтобы письма пересылаемые, например, на user@alfresco.домен.ру попадали в определенную директорию вместе с вложениями.

keytocontent.blogspot.com/2010/05/upload-files-to-alfresco-via-email.html