Приветствую вас, уважаемые читатели блога Rabota-Vo.ru! Где-то пару лет назад мне понадобилось, чтобы текст из одной книги (несколько десятков страниц) оказался у меня на компьютере в программке Word. Цель была простая – немного отредактировать, вставить несколько фотографий, чтобы в итоге получилась скромная презентация. В то время я еще был далек от программ, которые могут распознавать тексты со сканированных листов. Про онлайн сервисы, на которых можно сделать распознавание текста, я вообще в то время не слышал. И первое, что мне попалось в тот момент в интернете – бесплатная программа для распознавания текста CuneiForm.
От результатов, полученных после распознавания, я, конечно, был не в восторге, но вполне доволен. К тому же программа бесплатная, а разобраться, как с ней работать, не составило большого труда.
Для того чтобы скачать бесплатно и установить программу распознавания текста CuneiForm к себе на компьютер и посмотреть качество ее работы, нужно зайти на официальный сайт разработчика Cognitive Technologies. Программа Cognitive OpenOCR (CuneiForm) официально является бесплатной, и русская версия весит всего 32,1 МБ. Устанавливается программа довольно быстро и просто, а при запуске, прочитав внимательно рекомендации, можно сделать предварительные настройки.
Программа имеет довольно скромный интерфейс и минимальные функции. Может распознать документы на 24 языках и печатные шрифты из книг, журналов, газет и т.д. Есть возможность распознавания текста со сканера прямо из программы.
К сожалению, не принимает к распознаванию документы с расширением PDF, а сохранить может только в Word или Excel. Все очень скромно и качество распознавания текстов кому-то может показаться тоже «скромным», а кому-то, может, и нет. Все познается в сравнении. А для сравнения хочу предложить читателям блога программу для распознавания текстов ABBYY FineReader.
Конечно, программа эта платная. Но я предлагаю не покупать ее, а посмотреть, как она работает, и сравнить качество выдачи распознаваемого текста. К тому же разработчик предлагает пятнадцатидневную бесплатную демоверсию. Возможно, в дальнейшем эту программу кто-то и пожелает приобрести.
Безусловно, FineReader – это «монстр» в области распознавания текстов с различных документов (фотографий, изображений и любых сканированных документов разного расширения). Для того чтобы посмотреть отличия между бесплатной программой CuneiForm и платной FineReader, я скачал с сайта разработчика демоверсию ABBYY FineReader 10 Home Edition в урезанном варианте размером 110 МБ. Хотя можно скачать для ознакомления и профессиональную версию ABBYY FineReader 12 Professional . Она, правда, немного потяжелей – 351 МБ, но и возможностей у нее больше. Я решил остановиться на версии для домашнего использования Home Edition. И вот маленький пример выделенной области отсканированного и распознанного текста из первой, попавшей под руку книги.
Этот результат распознавания текста из книги получился при помощи программы CuneiForm:
А этот вариант распознанного текста выдала программа ABBYY FineReader 10 Home Edition:
Как видите, различия между результатами довольно существенные. Возможно, не стоило бы сравнивать эти абсолютно разные программы. Но программа CuneiForm, разработанная российской компанией Cognitive Technologies, является бесплатной и общедоступной для любого пользователя. И использовать эту программу для распознавания небольших текстов вполне можно. К тому же CuneiForm имеет открытый код, и желающие могут принять участие в разработке программы.
А что касается программ лидера распознавания текстов ABBYY FineReader, за выложенные «кровные» можно получить и качество и комфорт (имею в виду удобный и современный интерфейс программы). Сразу хотел бы дать совет охотникам за «пиратскими» версиями коммерческих программ, которые, конечно, есть в интернете. Посмотрите рекомендации специалистов на предмет «пиратских» систем и программ. В какой то момент может компьютер заблокироваться. Возможно, будет достаточно использовать онлайн сервисы по распознаванию текстов или официально доступные к бесплатному использованию программы.
На этом хочу пожелать всем читателям удачи и успехов. До новых встреч на страницах блога Rabota-Vo.ru.
Вас это может заинтересовать:
Комментарии