Распознавание текстов в Ubuntu

Наверняка используя Ubuntu у вас возникают периодически вопросы, связанные с тем, какое программное обеспечение нужно установить, чтобы оно, например, могло делать что-то похожее на программы, выполнявшие эти же задачи в Windows. Потому что в школах, техникумах, ВУЗах нас учат работать с Windows. Даже свои первые дистрибутивы Linux мы получаем скачивая их под этой операционной системой. Но ситуация постепенно меняется и в лучшую сторону. Уже давно появился центр приложений Ubuntu, в котором можно найти нужное, набирая в строке поиска запрос. Так, например, легко найти графические редакторы, музыкальные и видео проигрыватели, учебные и даже научные приложения. Но пока ещё не всё хорошо, как хотелось бы. В данной статье поговорим о системе распознавания текстов. И в качестве примера возьмём аналог Abbyy FineReader — систему распознавания текстов в графических файлах. Есть ли аналог в Linux, который хотя бы в самом близком приближении смог бы с ним конкурировать?

Первые же результаты поиска ведут к Cuneiform — открытому свободному программному обеспечению, позволяющему распознавать тексты в графических файлах. В репозитории Ubuntu этот пакет присутствует и легко может быть установлен. Однако это консольный вариант утилиты. Не все «гурманы» Ubuntu смогут оценить и воспользоваться командной строкой cuneiform. Поэтому мы сразу решили установить и графический интерфейс — yagf. По отзывам пользователей yagf, в отличие от других пакетов, позволяет работать со сканером (для этого нужно установить также пакет XSane). Пакет yagf, в отличие от cuneiform, в стандартном репозитории отсутствует. Мы решили установить оба пакета из одного репозитория, чтобы избежать возможных конфликтов. Для этого мы выполняем помещаем следующую команду в консоль:

После добавления нового источника, скачиваем ключ:

Далее обновляем базу пакетов: sudo apt-get update После этого используем знакомую нам связку: sudo apt-get install cuneiform yagf (Указанные операции проводились в Ubuntu 10.04 с обновлениями, выполненными 27.08.2010.) У нас пиктограмма yagf появилась в меню Графика — жёлтые прищуренные глаза. Этот пакет позволяет обрабатывать в графическом режиме сразу множество загруженных любым способом изображений. Этим утилита очень напоминает FineReader. Теперь о качестве распознавания cuneiform. К сожалению, в режиме «Язык распознавания русский-английский» распознаются только русские слова. Если оценивать по пяти-бальной системе качество распознавания русского текста, то cuneiform можно поставить твёрдую тройку, что для бесплатного аналога дорогого FineReader (рекомендованная цена на 27.08.2010 Home Edition составляет 1490 рублей) достаточно хорошо. А вы чем распознаёте изображения в Ubuntu? Кстати если Вас интересует монтаж металлоконструкций, советуем обратиться к сайту argo-m.ru.