SimpleOCR (Optical Character Recognition) – приложение для распознания отсканированного текста на иностранных языках (английский, французский, голландский). OCR (оптическое распознание символов), помимо распознания, позволяет редактировать текст, находить слово или фразу по средствам ввода искомой комбинации, анализировать, переводить, распечатывать, форматировать и т.д.
При должном качестве снимка точность распознания латинского текста достигает 99%. Оставшийся процент дается на ручную корректировку символов.
Словарь SimpleOCR содержит более 120 тысяч слов, причем его можно пополнять новыми словами вручную с помощью обычного текстового редактора.
Особенности SimpleOCR
- большой словарь;
- возможность удаления пятен со снимков с низким качеством;
- сохранение полного форматирования исходного файла (т.е. сохраняется шрифт и выделения, отображенные на взятом файле (размер, курсив, жирный и т.д.), помимо текста остаются картинки);
- распознание пакетов текстов;
- экспортирование результатов в файлы с форматами txt, rtf, tiff;
- упрощенный метод коррекции допущенных ошибок;
- возможность распознания не всего файла, а выделенного объекта;
- низкие требования к системе и малый вес (9,29 Мб);
- свободное распространение.