Распознавание текста онлайн

Хорошие сервисы на бесплатной основе

Первый сервис — это Диск Гугл. Необходимо зарегистрироваться в браузере. Если пользователь имеет отношение к ведению блока на этом сервисе, ведению ютуб канала, то у него уже есть аккаунт.

Если для распознавания берётся текст в PDF, то система обработает только первые десять. Сохраняется работа в вордовском документе, блокноте, пдф-формате.

Второй сервис — i 2 OCR. Пользователю также придётся пройти регистрацию. Программа распознает следующие форматы:

  • PPM;
  • PBM;
  • GIF;
  • JPEG .

Сервис позволяет загружать документы до 10 МБ. Результат преобразовывается в текстовый файл формата DOC.

Третий сервис — OCR CONVERT. Пользователю предоставляются услуги по распознаванию файлов на бесплатной основе и без регистрации. Поддерживаются различные форматы изображения. Результат сохраняется в виде интернет-ссылки, которая имеет расширение TXT. Пользователь может скопировать результат и вставить в любой файл. На сервисе можно загружать одновременно пять документов, которые не превышают 5 МБ.

Четвёртый сервис — ONLINE OCR. Пользователю не нужно регистрироваться и платить деньги за работу программы. На сервисе можно распознать 15 изображений за час. Файлы принимаются разных форматов. Результат сохраняется в вордовском, текстовом формате, а также в таблице. Минус сервиса — постоянная капча во время работы. Для распознавания доступно 32 языка

Пятый сервис — OcrOnline. Разработчики рекомендуют, чтобы изображения были в высоком качестве, формата JPG. Также можно использовать и другие форматы. Минус сервиса — за одну неделю распознаётся только 5 страниц.

https://youtube.com/watch?v=GzCTPs-WcH8

Распознавание текста онлайн без регистрации

Online OCR

Online OCR  http://www.onlineocr.net/  – единственный наряду с Abbyy Finereader сервис, который позволяет сохранять в выходном формате картинки вместе с текстом. Вот как выглядит распознанный вариант с выходным форматом Word:

Результат распознавания в Online OCR (ФИО и дата распознаны, но стерты вручную)

Входные форматы PDF, TIF, JPEG, BMP, PCX, PNG, GIF
Выходные форматы Word, Excel, Adobe PDF,  Text Plain
Размер файла До 5Мб без регистрации и до 100Мб с ней
Ограничения Распознает не более 15 картинок в час без регистрации
Качество Качество распознавания свидетельства инн оказалось хорошее. Примерно как у Abbyy Finereader – какие-то части документа лучше распознались тем сервисом, а какие-то – этим.

Как пользоваться

  1. Загрузите файл (щелкните «Select File»)
  2. Выберите язык и выходной формат
  3. Введите капчу и щелкните «Convert»

Внизу появится ссылка на выходной файл (текст с картинками) и окно с текстовым содержимым

Free Online OCR

Free Online OCR  https://www.newocr.com/ позволяет выделить часть изображения. Выдает результат в текстовом формате (картинки не сохраняются).

Входные форматы PDF, DjVu  JPEG, PNG, GIF, BMP, TIFF
Выходные форматы Text Plain (PDF и Word тоже можно загрузить, но внутри них все равно текст без форматирования и картинок).
Размер файла До 5Мб без регистрации и до 100Мб с ней
Ограничения Ограничения на количество нет
Качество Качество распознавания свидетельства инн плохое.

 Как пользоваться

  1. Выберите файл или вставьте url файла и щелкните «Preview» — картинка загрузится и появится в окне браузера
  2. Выберите область сканирования (можно оставить целиком как есть)
  3. Выберите языки, на которых написан текст на картинке и щелкните кнопку «OCR»
  4. Внизу появится окно с текстом

OCR Convert

OCR Convert http://www.ocrconvert.com/ txt

Входные форматы Многостраничные PDF, JPG, PNG, BMP, GIF, TIFF
Выходные форматы Text Plain
Размер файла До 5Мб общий размер файлов за один раз.
Ограничения Одновременно до 5 файлов. Сколько угодно раз.
Качество Качество распознавания свидетельства инн среднее. (ФИО распознано частично). Лучше, чем Google, хуже, чем Finereader

Как пользоваться

      1. Загрузите файл, выберите язык и щелкните кнопку «Process»
      1. Появится ссылка на файл с распознанным текстом

Free OCR

Free OCR www.free-ocr.com распознал документ хуже всех.

Входные форматы PDF, JPG, PNG, BMP, GIF, TIFF
Выходные форматы Text Plain
Размер файла До 6Мб
Ограничения У PDF-файла распознается только первая страница
Качество Качество распознавания свидетельства инн низкое – правильно распознано только три слова.

Как пользоваться

      1. Выберите файл
      2. Выберите языки на картинке
      3. Щелкните кнопку «Start»

I2OCR

I2OCR http://www.i2ocr.com/ неплохой сервис со средним качеством выходного файла. Отличается приятным дизайном, отсутствием ограничений на количество распознаваемых картинок. Но временами зависает.

Входные форматы JPG, PNG, BMP, TIF, PBM, PGM, PPM
Выходные форматы Text Plain (PDF и Word тоже можно загрузить, но внутри них все равно текст без форматирования и картинок).
Размер файла До 10Мб
Ограничения нет
Качество Качество распознавания свидетельства инн среднее – сравнимо с OCR Convert.

Замечено, что сервис временами не работает.

Как пользоваться

  1. Выберите язык
  2. Загрузите файл
  3. Введите капчу
  4. Щелкните кнопку «Extract text»
  5. По кнопке «Download» можно загрузить выходной файл в нужном формате

Freemore OCR

Программа позволяет оперативно извлекать текст и графику с изображений. Софт поддерживает работу с несколькими сканерами без потери производительности. Извлеченный текст может быть сохранен в формате текстового документа или документа MS Office.

Кроме того предусмотрена функция многостраничного распознавания.

Распространяется Freemore OCR бесплатно, однако, интерфейс только на английском. Но это обстоятельство никак не влияет на удобство пользования, потому как организованы элементы управления интуитивно понятным образом.

Достоинства:

  • бесплатное распространение;
  • возможность работы с несколькими сканерами;
  • достойна точность распознавания.

Недостатки

  • Отсутствие русского языка в интерфейсе;
  • Необходимость загрузки русского языкового пакета для распознавания.

WinScan2PDF

Как таковой программой – не назовешь. Это скорей всего утилита. Её размер поражает, так как он, всего несколько килобайт. Установки не требует. Работает как с жесткого диска, так и с карты памяти. Что добавляет удобности в использовании. Интерфейс утилиты, предельно ясен и ограничен несколькими кнопками для её управления. Такими как: «выбор источника фото», «выбор места назначения», и запуск программы. Имеет так же и массу языковых расширений.

Главным её функционалом, является массовая обработка документов. Выходящий тестовый файл, сохраняет исключительно в. pdf формате. Что не все пользователям нравится, но, как говорится – «деваться некуда». Довольствуемся тем, что имеем.

Плюсы программы:

  • Портативность;
  • Понятный интерфейс;
  • Высокая скорость работы.

Недостатки программы:

  • Всего один формат исходящего текстового файла;
  • Небольшие неточности в переводе.

Оцифровка текста с изображения

Первый сервис для сканирования текста с изображения — это IMG Online. Программа занимается опознаванием изображения в разных форматах — BMP, GIF, JPEG, PNG, TIFF.

Порядок действий:

  • Выбрать файл для загрузки.
  • Настроить язык для обработки. Выбирается основной язык из списка. Если на изображении есть не только русские слова, то следует выбирать дополнительный язык для обработки. Если указаны только символы основного языка, нет надобности устанавливать дополнительные языки.
  • Сделать дополнительные настройки. Необходимо выбрать предварительную оптимизацию фото и улучшение скана документа. Если отсканированный формат качественный, то галочку на втором пункте можно и не ставить.
  • Выбрать программу для распознавания текста.
  • Нажать на ок.

Обработка данных длится около 20−60 секунд, после чего программа выдаст результат работы, который можно сохранить в удобном месте.

Ещё одним сервисом, который распознает текст с изображения, является Free online Ocr. На русский язык интернет-страница переводится автоматически. Распознаватель предоставляется бесплатно, также не нужна регистрация от пользователя. Порядок работы идентичный: необходимо загрузить файл с компьютера или ввести адрес сайта, выбрать язык и нажать на «Старт». После этого пользователю будет доступен файл для скачивания.

Можно воспользоваться сервисом NewOCR. Пользователю не нужно проходить регистрацию, предоставляется неограниченное количество загрузок

Обратить внимание необходимо и на cuneiform. Её нужно скачать напрямую или через торрент

Программа производит считывание текста со скриншотов.

Originally posted 2018-04-07 11:51:15.

PDFelement Pro

 Программа PDFelemnt PRO — комплексное решение задач по работе с PDF файлами. ПО может на равных конкурировать со своими аналогами. Здесь есть много функций, которые могут понадобиться при работе с текстом, в том числе — функция распознавания текста. У программы специфичный набор функций, которые не связаны с распознаванием текста. 

Распознавание текстов

 PDFelement PRO создан для работы работы с форматом PDF. Бесплатная версия программы позволяет редактировать, аннотировать, создавать, объединять и разделять PDF файлы. Распознавание текста доступно только в платной версии, но качество и результаты работы остаются на высоком уровне. 

Дополнительные функции

 С помощью программы можно делать документы конфиденциальными (ставить на файлы пароль), можно создавать готовые шаблоны, ставить штамы и т.д. В целом, программа подойдет больше тем, кто работает с PDF файлами. Хотя в ней и есть функция распознавания рукописного ввода, она здесь не является главной.

Online OCR

Платформа: веб

Лицензия: условно-бесплатная

Распознает: JPG, GIF, TIFF, BMP, PNG, PCX, PDF

Сохраняет: TXT, DOC, DOCX, XLSX, PDF

На этом сервисе пользователи могут провести распознавание текста бесплатно и сохранить результат в редактируемые текстовые файлы без установки софта. Поддерживается работа со сканами, популярными форматами графики, сканами и PDF. Без регистрации и оплаты доступно распознование только 15 страниц в час. После авторизации данный лимит повышается до 50, а также увеличивается допустимый размер (200 МБ).

Особенности:

  • обработка текста в зависимости от особенностей оригинального языка;
  • редактирование результата в режиме прямого времени;
  • объединение обрабатываемых файлов в единый проект;
  • анализ отдельных страниц документа.

Программы для распознавания текста с картинки

OCR CuneiForm. Это открытая система оптического преобразования сканированных документов. Особенностью программы является то, что в ней можно распознавать в печатные страницы с одновременным использованием разных языков. Скачать OCR CuneiForm можно бесплатно на официальном сайте компании. Процесс установки на ПК стандартный.

Рабочее пространство довольно удобно, а интерфейс, представленный на русском языке, интуитивно понятен. Недостатком OCR CuneiForm является то, что разноцветные надписи практически не выводятся, а если черно-белое изображение плохого качества, результат получится с большим количеством ошибок.

RiDoc. Программа качается на ПК бесплатно, однако пользоваться основными функциями можно только в течение 30 дней. Далее необходимо платить. RiDoc удобен в использовании и имеет большой инструментарий для получения качественного результата. Чтобы преобразовать, необходимо нажать на кнопку «Открыть», загрузить документ и начать процесс. Результат можно загрузить в документ Word.

ABBYY FineReader. На сегодняшний день это наиболее популярная и раскрученная российская программа, распознающая текст с картинки. Для удобства пользователей здесь предусмотрен бесплатный тестовый период. Полная подписка стоит 7 тысяч рублей. Отличительной чертой является то, что с ее помощью можно преобразовывать таблицы и математические формулы, конвертируя данные в документы различных форматов.

Abbyy Fine Reader

Программа для распознавания текста с картинки от разработчика ABBYY считается одной из лучших. В своем функционале имеет множество инструментов. В зависимости от версии она работает и с djvu-файлами.

Источник сканов

Сканирование. Перед началом работы с растровыми изображениями необходимо настроить сканер текста с фото. В настройках указывается максимальное количество точек на дюйм (DPI). Рекомендуемое значение не ниже DPI 300. Чем больше этот показатель, тем выше качество и меньше вероятность возникновения ошибок.

Цветность. От цветности зависит скорость сканирования. Среди основных ее настроек три варианта:

  1. Черно-белый — подходит для сплошного текста.
  2. Оттенками серого можно воспользоваться, если нужно сканировать документ, содержащий картинки, таблицы и текст.
  3. Цветным режимом пользуются, когда идет оцифровка журналов и периодики, для которых цветопередача важнее содержания.

Фотография. Программа для считывания текста с картинки работает не только со сканами, но и с фотографиями, снятыми на фотоаппарат или на смартфон в хорошем разрешении. Но как показывает практика, снимки со смартфона имеют искажения, которые влияют на распознавание.

Распознавание графических документов

Утилита работает почти со всеми популярными файлами с расширением jpeg, bmp, png, tiff. Рабочая область имеет два экрана. На левом находится исходник, на правом — результат. После загрузки фото в программу производится его распознавание, но не всегда процедура происходит корректно. Часто приходится прибегать к ручному режиму. Если есть выход в интернет, то полученный результат можно проверить на орфографические ошибки.

Текст. На панели инструментов есть иконка «Т», которая при выделении области исключает работу с таблицами и изображениями. При наличии на странице нескольких таблиц, выделять текст придется несколькими блоками. После чего нажимается иконка «Распознать».

Таблицы. Работа с таблицами сопряжена с некоторыми трудностями. Внутреннее содержание распознается и вставляется в Excel. Но если необходимо ту же таблицу разместить на странице Word, то ее придется создавать заново, а распознанные данные вставляются с ошибками.

Изображения. При необходимости копирования изображений со сканированного листа они просто выделяются, копируются и вставляются. Не нужно пользоваться графическим редактором для обрезки. Word обладает рядом инструментов для редактирования изображений.

Ненужные области. На отсканированных страницах встречаются области, мешающие работе, такие как реклама и колонтитулы. Перед работой с документами эти области следует удалить. В Fine Reader есть функция «ластик». С ее помощью ненужная область удаляется полностью до белого листа.

Работа с DJVU и PDF

Документы этих форматов не что иное, как графические изображения, преобразованные в формат меньшего объема. И хранить таких документов можно значительно больше на ограниченном объеме памяти.

Распознавание и чтение файлов djvu и pdf идет по всей странице, включая номера страниц и колонтитулы. Это затрудняет дальнейшее редактирование. Чтобы исключить лишнюю информацию в программе устанавливаются дополнительные настройки, ограничивающие рабочую область. Делается это следующим образом:

  • Редактирование → работа с изображениями.
  • Активировать опцию «Обрезка».
  • Установить границы обработки.
  • Сохранить настройки кнопкой «Применить ко всем страницам».

Handy Scanner – простой и удобный сканер документов

Приложение Handy Scanner отличается едва ли не более простым интерфейсом, чем предыдущее. Но при этом данный сканер обладает неплохими возможностями для создания многостраничных документов в бытовых условиях.

К сожалению, бесплатная версия имеет некоторые ограничения. Во-первых, максимальное количество документов составляет всего 20, по 5 страниц в каждом. Пакетная съемка ограничена тремя кадрами подряд. Реклама. Низкое и среднее качество изображения, а также отсутствие некоторых настроек при улучшении. Наконец, на PDF накладывается водяной знак.

Итак, приступаем к съемке. Используется собственный интерфейс для камеры, звук щелчка затвора присутствует. В настройках – включение вспышки, сетка и уровень. Возможна пакетная съемка, впоследствии обработка каждого фото выполняется отдельно.

Автоматическое определение границ срабатывает отлично, наше вмешательство минимально. Следующий шаг – улучшение, доступно шесть режимов. Напомним, что предусмотрены дополнительные настройки, но только для платной версии. После завершения редактирования изображение помещается в уже существующий или новый документ.

Также хочется заглянуть в настройки самого приложения. Полученные снимки можно автоматически сохранять в хранилище Dropbox или Google Drive, используя любое подключение или только Wi-Fi. При желании можно использовать системную камеру, отключить определение углов и фильтры, задать ориентацию страницы и ее размер.

В заключение хочется отметить быструю работу приложения и его качество в целом. Несмотря на скромный вид, Handy Scanner отлично справляется со своей задачей.

SimpleOCR

Отличная небольшая программа для распознавания текстов с изображений. Поддерживает даже чтение рукописей. Беда в том, что русский не входит ни в языковой пакет интерфейса, ни в список поддерживаемых для распознавания языков.

Однако если необходимо отсканировать английский, датский или французский, то лучшего бесплатного варианта не найти.

В своей области программа обеспечивает точную расшифровку шрифтов, удаление шума и извлечение графических изображений. К тому же в интерфейс программы встроен текстовый редактор, практически идентичный WordPad, что значительно повышает удобство использования программы.

Достоинства:

  • точное распознавание текста;
  • удобный текстовый редактор;
  • удаление шума с изображения.

Недостатки:

полное отсутствие русского языка.

Сайт Convertio

Ещё одним способом распознавания текстов онлайн является сервис Convertio. Пользователь может бесплатно и без регистрации распознать 10 страниц, для увеличения количества придётся пройти регистрацию на сайте. Процедура распознавания текста:

  • Выбрать файл. При помощи красной кнопки необходимо выбрать способ загрузки файла: с компьютера, ссылка интернета, Диск Гугл, из Dropbox.
  • Выбрать язык. Есть четыре строки: для главного языка и три строки для дополнительного.
  • Выбрать формат. Система предоставляет более пяти форматов.
  • Ввести капчу.
  • Выбрать вариант для сохранения результата.
  • Преобразовать.

После чего можно скачать файл на компьютер или на интернет-диск.

Genius Scan – сканер документов с простым интерфейсом

Разработчики данного приложения решили заложить в свое творение философию «все гениальное просто». Документ фотографируется, обрабатывается (слегка) и сохраняется в файл формата PDF. К чести создателей стоит признать, что приложение заслуживает интереса, хотя круг пользователей будет небольшим.

На закладке SCANS находятся изображения, которые пока что не были перемещены в определенный документ. Список можно пополнить при помощи камеры или импортом изображения. В последнем случае необходимо сначала включить камеру, а потом нажать на пиктограмму в левом нижнем углу. Genius Scan использует собственное приложение для камеры. Основное ее отличие – беззвучная работа. Пакетная съемка не поддерживается, однако возможность создавать многостраничные документы предусмотрена.

После получения снимка выполняется автоматическое определение границ документа. По нашим наблюдениям, примерно в 7 из 10 случаев границы определяются корректно, лишь иногда приходится принимать участие лично. Однако, в отличие от Droid Scan Lite, хлопот это не доставляет.

После обрезки выполняется улучшение цвета. Доступны следующие режимы: без изменений, цвет и черно-белый. Режимы можно выбирать как вручную, так и установить «по умолчанию».

После завершения редактирования изображение можно вставить в уже существующий документ как следующую страницу или в новый документ. Чтобы создать очередную страницу документа, весь процесс придется повторить заново.

ABBYY FineReader 10

FineReader безоговорочный лидер среди всех программ, распознающих текст на изображении. В частности, софта, более четко обрабатывающего кириллицу нет. Вообще в активе FineReader 179 языков, текст на которых распознается чрезвычайно успешно.

Единственное обстоятельство, которое может разочаровать пользователей, состоит в том, что программа платная. Бесплатно распространяется только пробная версия на 15 дней. За этот период разрешено сканирование 50-ти страниц.

Дальше за пользование программой придется платить. FineReader легко «кушает» любое более-менее качественное изображение. Источник при этом совершенно неважен. Будь то фотография, скан страницы или любая картинка с буквами.

Достоинства:

  • точное распознавание;
  • огромное количество языков чтения;
  • толерантность к качеству изображения-источника.

Недостаток:

пробная версия на 15 дней.

OCR CuneiForm

Платформа: Windows, Linux, mac OS

Лицензия: бесплатная

Распознает: JPG, TIFF, BMP, PNG, снимки со сканера

Сохраняет: DOCX

Программа для распознавания текста по фото OCR CUneiForm направлена только на одно действие – перехват со сканера изображений и преобразования содержащейся на них текстовой информации. Также допускается открытие графических файлов с персонального компьютера. После этого работу можно продолжить в любом текстовом редакторе. Разрешается работать в одиночном или пакетном режиме.

Особенности:

  • может использоваться вместо стандартного софта для сканирования;
  • преобразование графических файлов в редактируемый документ Ворд;
  • анализ документа на наличие форм, таблиц, изображений;
  • поиск по созданному текстовому файлу;
  • распознавание на отдельных выбранных областях.

TopOCR

 Еще одно онлай-решение в области распознавания текста. Когда-то программа была бесплатной, но сейчас ее нужно приобрести чтобы использовать. С другой стороны, у нее есть преимущества:  

  • Нейросеть для работы с текстами — одна из самых продвинутых, на достойном уровне конкурирует с аналогами.
  • TopOCR поддерживает конвертацию из изображения в формат документа.
  • Разработчики представили оригинальный девайс — специальную камеру, которая может автоматически распознать текст на листе бумаги, достаточно просто поднести его к камере.

Некоторые специалисты признали, что у TopOCR самые лучшие алгоритмы распознавания текста. С другой стороны, сервис платный, а значит подходит не для всех пользователей. 

ABBYY Screenshot Reader

Отличие приложения ABBYY Screenshot Reader от предыдущего состоит в схеме распознавания. Если в FineReader вы просто загружаете документ и работаете, то в этой утилите все иначе – она просто считывает данные с экрана и преобразует их.

Работает Screenshot Reader в двух режимах – создании скриншотов и распознавании текста с экрана. Если вам нужно второе, сначала просто нажимаете на комбинацию клавиш, выбираете язык и принцип захвата, выделяете область, подтверждаете действие и ждете несколько секунд. Полученные данные сохранятся в выбранном вами формате. В приложение встроен словарь и переводчик, также другие полезные функции от компании ABBYY.

По умолчанию сервис распознает тексты на 5 языках – английском, русском, русско-английском, французском и немецком. Есть возможность добавления других языковых пакетов.

Плюсы

  • Быстрый запуск посредством нажатия на комбинацию клавиш.
  • Встроенная функция перевода и проверки орфографии.
  • Есть запись экрана с функцией отсрочки.
  • Распознавание текста с любого окна, даже в защищенном режиме.
  • Создание скрина с любой, даже защищенной области экрана.
  • Сохранение в нескольких форматах – rtf, txt, doc или xls.

Минусы

  • Для копирования полученных данных в редактор нужно выделять материал вручную.
  • Открыть файл через этот сервис не получится – только ручной захват экрана.
  • Приложение не бесплатное. Есть бессрочная лицензия, но она стоит 1490 рублей. А срок действия пробной версии составляет всего лишь 7 дней, также в ней есть ограничение до 100 страниц.

Программы для распознавания текста

Как правило, если речь заходит о программах для распознавания сканированного текста (OCR, оптическое распознавание символов), большинство пользователей вспоминают единственный продукт — ABBYY FineReader, который, бесспорно, является лидером среди такого программного обеспечения в России и одним из лидеров в мире.

Тем не менее, FineReader — не единственное такого рода решение: есть бесплатные программы для распознавания текста, онлайн-сервисы для этих же целей и, более того, такие функции присутствуют и в некоторых знакомых вам программах, которые, возможно, уже установлены на вашем компьютере. Обо все этом я и постараюсь написать в этой статье. Все рассмотренные программы работают в Windows 7, 8 и XP.

WinScan2PDF

Это даже не полноценная программа, а утилита. Установка не потребуется, а исполнительный файл весит всего в несколько килобайт. Процесс распознавания происходит предельно быстро, правда, полученные в его результате документы сохраняются исключительно в формате PDF.

Фактически весь процесс выполняется при нажатии трех кнопок: выбор источника, места назначения и, собственно, запуска программы.

Утилита предназначена для быстрой пакетной обработки множества файлов. Для удобства пользователей предусмотрен большой языковой пакет интерфейса.

Достоинства:

  • портативность;
  • быстрая работа;
  • простота в использовании.

Недостатки:

  • минимальный размер;
  • единственный формат файлов на выходе.

ТОП-5 программ для распознавания рукописных текстов

За время существование компьютеров было создано много программ, которые умеют интерпретировать рукописный ввод. С течением времени они развивались и улучшались. На сегодняшний день есть программы, которые могут с очень высокой точностью распознавать текст, написанный от руки, при этом они  поддерживают все самые распостраненные языки в мире.

Выбирать программу нужно исходя из своих потребностей, потому что у них разные функционал и стоимость (бесплатные или платные). Популярных программ много, но не все качественно справляются со своими задачами.  Мы выделили ТОП-5 лучших, с помощью которых можно будет решить проблему распознавания рукописного ввода. Давайте рассмотрим каждую подробнее.

Как работает распознаватель текста с картинки

Каждое изображение представляет собой сетку пикселей, то есть набор точек, из которых складываются образы. Программное обеспечение или онлайн-сервисы выделяют на общем фоне отдельные буквы и осуществляют перевод в печатный формат. В процессе работы структура документа детально анализируется специальным алгоритмом, который выделяет блоки, проставляет линии делений на слова, а затем символы.

Полученные знаки и буквы сравниваются с имеющимися шаблонами алфавита и цифр, после чего алгоритм принимает решение, что именно это за символ, и выдает готовый результат. Поскольку надписи бывают некачественными, а алгоритмы — несовершенными, возникают ошибки в интерпретации отдельных букв (целые слова редко путаются с другими).

Лидер распознавания текстов — программа ABBYY Finereader

Про FineReader (произносится как Файн Ридер) слышали, наверное, большинство из вас. Эта программа лучшая или одна из лучших для качественного распознавания текстов на русском языке. Программа является платной и цена лицензии для домашнего использования составляет чуть менее 2000 рублей. Также имеется возможность скачать пробную версию FineReader или же воспользоваться онлайн распознаванием текстов в ABBYY Fine Reader Online (бесплатно можно распознать несколько страниц, далее — платно). Все это доступно на официальном сайте разработчика http://www.abbyy.ru.

Установка пробной версии FineReader не вызвала никаких проблем. ПО может интегрироваться с Microsoft Office и Проводником Windows, для того чтобы было удобнее запустить распознавание. Из ограничений бесплатной пробной версии — 15 суток использования и возможность распознать не более 50 страниц.

Снимок для тестирования программ распознавания

Так как сканера у меня нет, то для проверки я воспользовался снимком с некачественной камеры телефона, в котором немного отредактировал контрастность. Качество никуда не годное, посмотрим, кто справится.

Меню программы FineReader

FineReader может получать графическое изображение текста напрямую со сканера, из графических файлов или камеры. В моем случае, достаточно было открыть файл изображения. Результат порадовал — всего пара ошибок. Сразу скажу, что это лучший результат из всех проверенных программ при работе с данным образцом — похожее качество распознавания было только на бесплатном онлайн сервисе Free Online OCR (но в этом обзоре мы говорим только о программных средствах, не онлайн распознавании).

Результат распознавания текста в FineReader

Откровенно говоря, для кириллических текстов у FineReader, наверное, нет конкурентов. Плюсами программы является не только качество распознавания текстов, но и широкая функциональность, поддержка форматирования, грамотный экспорт во множество форматов, включая Word docx, pdf и другие возможности. Таким образом, если задачи OCR — это то, с чем вы сталкиваетесь постоянно, то не пожалейте сравнительно небольшого количества денег и это вполне окупится: вы сэкономите огромное количество времени, быстро получая качественный результат в FineReader. Я, кстати, не рекламирую ничего — действительно считаю, что тем, кому нужно распознать больше десятка страниц, стоит задуматься о покупке такого ПО.

Вывод

Если вы работаете с текстом постоянно и профессионально, то вам подойдет софт Abbyy Fine Reader.

Однако, если нужна именно бесплатная программа, то вполне удастся обойтись и OCR Cunei Form.

Для простой и быстрой работы со скриншотами скачайте Abbyy Screenshot Reader, но строго говоря, без этой программы вообще можно обойтись.

Если распознавание – только одна, и не самая частая задача при вашей работе с документами, то отдайте предпочтение многофункциональной Adobe Acrobat, способной заменить множество программ.

Если де необходимость в распознавании единична, то используйте Free Online OCR.

Рейтинг
( Пока оценок нет )
Editor
Editor/ автор статьи

Давно интересуюсь темой. Мне нравится писать о том, в чём разбираюсь.

Понравилась статья? Поделиться с друзьями:
Союз-Маркет
Добавить комментарий

;-) :| :x :twisted: :smile: :shock: :sad: :roll: :razz: :oops: :o :mrgreen: :lol: :idea: :grin: :evil: :cry: :cool: :arrow: :???: :?: :!: