Мтааламу - для профи и профессиональных любителей

Встреча 31.05.2013

Собственно сабж, предлагаю ТК как обычно в 19-00 — 19-30

Удобное распознавание текста в Linux

Несмотря на то, что в Linux вполне себе существуют командные утилиты для распознавания текста (gocr, cuneiform, tesseract) мне нехватало удобного интерфейса чтобы хоть как-то заменить Fine Reader, пока не нашел GTK утилиту ocrfeeder.

Утиль позволяет самому размечать область распознавания (может и автоматически, но не очень хорошо это делает), распознавать несколько страниц, экспортировать в опенофисовский формат, в PDF и т.п.



Утилита сама находит поддерживаемые OCR движки, можно подправить аргументы командной строки (чтобы, например, выбрать язык), можно самому сделать несколько вариантов выбора OCR движков с разными параметрами.

Мониторинг изменения файлов с помощью fspy

Нашел неплохую консольную утилиту fspy, которая позволяет рекурсивно отслеживать изменения в файлах (или просто когда происходит доступ), поддерживает множество фильтров и финтифлюшек,

Например для того, чтобы посмотреть какие события происходят в корневой файловой системе, рекурсивно со вложенностью на 1 уровень:

fspy -R 1 /


Получаем вывод:

[Tue May 28 19:34:16 2013] file was accessed:/dev/ptmx]

Распаковка и упаковка xlsx и docx

Форматы xlsx и docx являются по сути своей обычными zip файлами с наборами xml внутри.

Как распаковать я думаю и так понятно, а вот упаковать так, чтобы при открытии офис не выдавал ошибку можно с помощью 7z в консоли так:

7z a -tzip файл.xlsx -mx0 ./директория/*

Озвучка Футурамы

Пересматриваю Футураму на английском с субтитрами (по совету камрада FREExLOADER). Заинтересовался вопросом: кто озвучивал персонажей сериала? Вот, оказывается, как это делается.



Еще здесь есть подобное видео.

Масштабы вселенной

Тут htwins.net/scale2/ в расстоянии одного клика находится интересная демонстрация масштабов вселенной. Впечатляет!



Консольный английский. Урок 3. Базовый словарный запас

В изучении иностранного языка без наращивания словарного запаса не обойтись, это понятно. Однако запоминать все слова подряд, конечно, не следует. Есть довольно ограниченный список самых общеупотребимых слов, на запоминание которых и нужно «подналечь». Список этот хорошо известен. Он используется, например, в методике Basic English, призванной упростить разговорный английский и сделать его языком межнационального общения. В лексиконе этого упроенного языка ровно 850 слов. Это как раз те слова, которые «стыдно не знать». На каком бы этапе изучения английского вы не находились, проверить свои знания на полноту соответствия базовому лексикону очень полезно. Я, например, обнаружил в своем словарном запасе немало пробелов. Затруднения вызвали 108 слов. Их я не смог перевести сходу, без дополнительных мнемонических усилий или даже обращения к словарю.

При работе с базовым английским лексиконом выработалась небезынтересная методика. Используя консольные команды и редактор vim я легко вычленил из списков слов те, которые следует подучить и сформировал из них отдельный файл. Подробности под катом.



( Читать дальше )

Ссылки изучающим английский

С удовольствием обнаруживаю, насколько легко и приятно в наши дни изучать иностранный язык. Точнее говоря это, конечно, всё равно большой труд, но благодаря Интернету в этом деле стало гораздо меньше рутины и больше того, что в том же английском называется «for fun».

Я уже приводил несколько полезных ссылок раньше. Сегодня рекомендую еще две. Первая — видеоканал www.youtube.com/user/JenniferESL. Преподаватель по имени Дженифер проделала просто гигантскую работу по популяризации английского языка. При этом немаловажно, что речь идет о языке разговорном, живом (хотя здравая доля академизма в ее видеоуроках присутствует и идет им только на пользу). Круг тем обширен: тут и идеомы, и работа над словарным запасом, и времена глаголов, и пунктуация. Ролики короткие, не более 10 минут. Повествование ведется на английском, но таком, что понятен и начинающим, хотя скорее эти материалы пригодятся тем, кто английский совершенствует, а не начитает с нуля. Для примера вот одно из видео Дженифер из подборки «Типичные ошибки в английском».



Еще одна ссылка — английские детские песенки с мультимедийными материалами и подстрочным переводом. Это уж мое собственное творение. С помощью немудреных скриптов собрал воедино тексты и музыку, где было возможно — добавил видео и переводы известных авторов (С.Я. Маршак, К.И. Чуковский), оснастил всё это собственным подстрочным переводом и выложил… на ucoz. А что, хостинг как хостинг, как раз для таких одноразовых вещей. Мне-то это все интересно только поскольку изучаю язык, потом вряд ли буду этот сайт развивать, а кому-то может и пригодится.

mothergoose.ucoz.com/

Chrome обжора?

Хотите знать сколько памяти потребляет ваш любимый Chrome? Вот вам однострочничек. Цитирую для ленивых:

Chrome sucks
$ ps -e -m -o user,pid,args,%mem,rss | grep Chrome | perl -ne 'print "$1\n" if / (\d+)$/' | ( x=0;while read line; do (( x += $line )); done; echo $((x/1024)) );

How much memory is chrome sucking?