Бесплатная программа для распознавания текста – CuneiForm.

Если Вам часто приходится сканировать книги, учебную литературу, и необходимо редактировать отсканированный текст,  Вам необходима программа для распознавания текста.

Существуют коммерческие программы для этих целей, одна из них является флагманом данного сегмента – ABBYY FineReader.

Попробуем разобраться, существует ли равноценная замена платной программе по распознаванию текста? Бесплатная программа по оптическому распознаванию текста есть, называется она – CuneiForm.

CuneiForm имеет опции сканирования и распознавания текста со сканера, также может распознавать сохраненные в формате jpg на компьютере результаты сканирования. Так же, по заявлениям разработчиков, программа может распознавать файлы в pdf формате, но не поддерживает при этом многостраничность.

ABBYY FineReader имеет опции сканирования и распознавания текста со сканера; распознавания файлов в формате jpg, pdf, djvu и др.

Здесь, как видите бесплатный продукт уступает платному. Ввиду стоимости коммерческого софта лично я смирился бы с урезанной функциональностью CuneiForm, в конце концов, нам нужно сканировать и качественно распознавать тексты – это главная, на мой взгляд, задача программ данного типа.

Лучше один раз увидеть, чем сто раз услышать. Поэтому приведу результаты распознавания текста с одного и того же сканера платной и бесплатной программой.
исходный текст для первого теста

 

Исходный текст, разрешение при сканировании 300dpi (Л.Н. Толстой «Война и мир»).

CuneiForm бесплатная программа для распознавания текста тест 1

Результаты работы CuneiForm.

ABBYY FineReader тест 1

Результаты распознавания ABBYY FineReader.

В данном тесте наблюдается примерное равенство, хотя видно, что ABBYY FineReader справился с задачей лучше своего оппонента. В основном из-за вкраплений французского языка, который CuneiForm не смог распознать, в силу того обстоятельства, что в составе словарей отсутствует русско-французский словарь и пришлось распознавать используя только русский язык. В свою очередь, в Fine Reader есть возможность установки нескольких языков для распознавания одновременно, чем я и воспользовался, установив русский и французский язык.

Данный пример достаточно редкий, ведь не часто приходится сканировать тексты с русским и французским языком одновременно, но все же…

Следующий тест был посложнее, текст + графика:

исходный текст для второго теста

Исходное изображение, разрешение сканирования 300dpi. (А.М. Волков «Волшебник Изумрудного города»)

CuneiForm бесплатная програма для распознавания текста тест 2

 

Все что смог CuneiForm.

ABBYY FineReader тест 2

 Результаты распознавания ABBYY FineReader

 

В данном тесте ни одна из программ не справилась с распознаванием этой страницы в автоматическом режиме, пришлось подправлять зоны распознавания для более корректного результата. Если довериться мастеру в CuneiForm Вы получите что получил я, но без картинки (маловато не правда ли?), в ABBYY FineReader отсутствовала  часть картинки.

После двух тестов придется согласиться с тем, что пока ABBYY FineReader немного превосходит по качеству распознавания текста  CuneiForm. С другой стороны разница в распознавании будет для Вас не критична, в случае если Вы работаете с текстом, где один язык и нет рисунков вставленных в текст как в нашем втором тексте.

Скачать бесплатную программу для распознавания текста – CuneiForm

Оцените, пожалуйста, статью, и поделитесь с друзьями

1 Звезда2 Звезды3 Звезды4 Звезды5 Звезд (Пока оценок нет)
Загрузка...

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *