Распознаватели текста (Text Recognition)

Если вам понравился шрифт на сайте или баннере, его можно найти и использовать. Популярные Arial или Times New Roman угадать можно, например, по отсутствию или присутствию засечек. Более редкие и незнакомые надписи можно распознать онлайн: по картинке или скриншоту. Рассказываю, как это сделать.

Зачем еще используют такие сервисы?

Допустим, так случилось, что у вас есть документ в бумажном виде, например, договор или статья, который ну очень нужно получить в цифровом виде. К сожаление, для того чтобы редактировать документ, его не получится просто отсканировать или сфотографировать, тогда у вас просто будет картинка, которая редактируется в графическом редакторе, а это не наш вариант, нам нужен документ.

Тогда на помощь приходит оптическое распознавание символов, именно эта технология поможет распознать текст, и получить его в текстовом виде, в документе, который откроется в Microsoft Word, Google Docs, и других текстовых редакторах в форматах DOC, RTF, XLS, PDF, HTML, TXT и других, в зависимости от программы или сервиса. Такой документ уже можно будет отправить отредактированным, и работать с ним дальше уже гораздо удобнее.

Условия успешного распознавания шрифтов

Чтобы программа смогла распознать шрифт, к картинке предъявляются определённые требования. Для большинства приложений и сервисов они одинаковы:

  • каждый символ отделён от соседних;
  • буквы имеют четкие, хорошо различимые контуры;
  • картинка сохранена в формате JPG или PNG (при необходимости ее можно переформатировать в графических редакторах);
  • качество изображения не снижается при масштабировании, поскольку многие программы требуют подгонки высоты букв под некий шаблон.

Порядок использования различных средств распознавания тоже имеет много схожего:

Далее рассмотрим наиболее популярные сервисы и приложения для распознавания шрифтов.

Распознавание текста с картинки

Устанавливаем и запускаем, через меню пуск, т.к. программа не создает ярлык на рабочем столе.

Распознавание текста с картинки

Ярлык CuneiForm v12. Можно использовать помощник, но я покажу как выбрать вручную. Нажимаем кнопку открыть файл, если необходимо выбрать картинку и сканировать если нужно сначала отсканировать изображение.

После того как открыли, нажимаем распознавание.

Распознавание текста с картинки

Когда текст распознается появится в верхнем окне текст, а внизу картинка. Если вы нажмете на любое место в тексте, программа внизу покажет это место на картинке, чтобы сравнить.

Читайте также:  Apple.com/bill – что это, сняли деньги с карты Сбербанка

Когда вы все проверили, вы можете сохранить на диске текст или же экспортировать его в word.

Распознавание текста с картинки

Онлайн распознавание текста бесплатно в гостевом режиме

Тем, кто пользуется услугой достаточно редко, и не желает связываться с созданием аккаунтов на сайтах, можно посоветовать несколько ресурсов, предоставляющих услуги без регистрации.

Онлайн распознавание текста бесплатно в гостевом режиме

NewOCR

Удобный сервис, которым можно пользоваться абсолютно без ограничений. Поддерживает 106 языков, количество загрузок не лимитируется. Качество распознавания – высокое: преобразование производится даже с плохо отсканированных страниц и некачественных фотографий. Возможна работа с графикой в низком разрешении. Входные расширения – jpeg, gif, bmp, pbm, tiff, pdf, djvu и другие. На выходе можно получить txt, doc, pdf.

Онлайн распознавание текста бесплатно в гостевом режиме

OCRconvert

OCRconvert– достаточно прост, хотя и немного уступает Free Online OCR по техническим возможностям. Работать можно с документами, загруженными со своего компьютера. Поддерживает 35 языков. Входные разрешения: jpeg, pdf, bmp, gif, png, выходное – txt. Одновременно можно загружать до 5 файлов, общим объемом до 5 МБ при условии, что они одноязычные. Количество конверсий неограниченно. Настройки производятся автоматически.

Порядок работы:

  • Выполнить загрузку.
  • Определить язык;
  • Подтвердить, что ты не робот;
  • Нажать кнопку «Процесс».

Итоговый результат предоставляется в виде ссылки на скачивание.

Онлайн распознавание текста бесплатно в гостевом режиме

Online OCR

Онлайн распознавание текста бесплатно в гостевом режиме

Итог отобразится в специальном окне.

Free OCR

Онлайн распознавание текста бесплатно в гостевом режиме

Итоговый результат будет представлен в txt, скачать его можно по ссылке.

i2OCR

Онлайн распознавание текста бесплатно в гостевом режиме

Сервисы с регистрацией

Как распознать и перевести текст с картинки онлайн

С помощью этого плагина, можно в пару щелчков мыши скопировать текст с любой картинки, PDF и даже видео. Также это расширение может служить как переводчик. Есть конечно и другие плагины для перевода, но они не могут читать текст с картинки и видео.

Преимущества:

Как распознать и перевести текст с картинки онлайн
  1. Copyfish — бесплатный плагин;
  2. Для извлечения текста, не нужно пользоваться отдельным сервисом или программой;
  3. Сканировать можно не только изображения в Интернете, но и на компьютере;
  4. Для быстрой работы с плагином, предусмотрены горячие клавиши.

Установите расширений в браузер. В верхнем правом углу должен появиться значок Copyfish. Далее, кликните по этой иконке, а затем выделите с помощью мышки текст в рамочку.

Отпустив клавишу, Вы получите через несколько секунд оригинальный текст и его перевод, если функция перевода включена в настройках.

Как распознать и перевести текст с картинки онлайн

Клавиши:

  1. Redo OCR – выполнить повторное распознавание;
  2. Recapture — выполнить захват снова;
  3. Re-translate – выполнить перевод еще раз;
  4. Copy to clipboard – скопировать в буфер обмена.

Подобным образом можно считывать текст и с локальных файлов, которые находятся на компьютере, будь-то PDF, изображение или видео. Для этого нужно перетащить файл с ПК в окно браузера Chrome, а затем выполнить действия описанные выше. В Mozilla эта возможность пока недоступна.

Как распознать и перевести текст с картинки онлайн

Как распознать текст с картинки — настройка плагина

Читайте также:  Apple выпустила iOS 14.6 beta 1. Что нового и как установить

Кликните правой клавишей мыши по иконке в правом верхнем углу браузера, а затем выберите «Параметры». Настройки я разделил на три блока:

  1. Input Language (OCR Language): выбрать язык, который нужно перевести по умолчанию.
  2. Input Language Quickselect: можно назначить до трех языков для быстрого перевода.
  3. Translate to: выбрать язык, на который будет выполнен перевод.
Как распознать и перевести текст с картинки онлайн
  1. Show Text Overlay: показать наложение текста. Так можно понять, какие слова были распознаны, а какие нет.

Здесь можно видеть, что был распознан весь текст, кроме слова «coloured», в нем не была распознана буква «d».

  1. Translate after OCR: переводить текст после распознавания.
  2. Text Box Font Size: задать размер шрифта;
  3. Support popup dictionaries: поддержка всплывающих словарей.
Как распознать и перевести текст с картинки онлайн

Быстрые клавиши

  1. Open grabbing screen — открыть захват экрана CTR+SHIFT+O;
  2. Close panel – закрыть панель CTR+SHIFT+ X;
  3. Copy text – скопировать текст CTR+SHIFT+ С.
Как распознать и перевести текст с картинки онлайн

Установка библиотеки

Первое, что необходимо сделать, то это выполнить установку Tesseract ORC. Установка Tesseract удобна на Маке и Линукс. Если вы на Windows, то придется выполнить на одно движение больше.

Если вы на Маке, то скачайте HomeBrew и далее в терминале пропишите brew install tesseract. Если вы на Линукс, тогда в зависимости от операционной системы вам нужно прописать соответствующую команду в терминале.

И если вы на Windows, то вам нужно скачать приложение на ПК. Вам нужно скачать файл Windows Installer. После скачивания выполните установку данной программы.

С самой программой вам никак не придется взаимодействовать, а лишь скопировать её расположение. Обычно оно устанавливается на диск С в Program files. Найдите вашу программу и скопируйте путь к этой папке.

— текстовый поиск шрифтов

Сервис использует текстовый способ опознания шрифта онлайн. При переходе на сайт вам предложат ответить (на выбор) на ряд наводящих вопросов на относительно:

  • внешнего вида шрифта (appearance);
  • его имени или части имени (name);
  • схожести с другими шрифтами (similarity);
  • отдельной картинке или символе, содержащемуся в шрифте (picture);
  • издателю или публикатору шрифта (designer/publisher).
— текстовый поиск шрифтов

Сам поиск ведётся на английском языке, потому пользователи, не владеющие оным, будут довольно скованы в осуществлении поисков на указанном сайте.

FreeOCR

FreeOCR — небольшое приложение для оптического распознавания текста. Утилита работает с графическими изображениями (tiff, jpeg, png), PDF-документами. Есть возможность прямого импорта файлов из сканера. Итоговый результат можно сохранить в формате обычного текстового файла или документа Microsoft Word.

Читайте также:  Как управлять группами и пользователями в Linux

Приложение полностью совместимо с операционной системой Windows (32/64 бит). Язык интерфейса — английский. Русская версия не поддерживается. Для комфортной работы с утилитой требуется ОС Windows XP и новее. Модель распространения программы — бесплатная.

После запуска программы FreeOCR откроется главное окно, в котором расположены основные инструменты для работы. На первом этапе необходимо загрузить файл. Для этого нужно выбрать пункт «Open» на панели инструментов.

После этого пользователям необходимо выбрать изображение (tif, bmp, png, jpg, gif) для распознавания текста, который хранится на компьютере. Также с помощью программы можно загрузить PDF-документ. Для этого необходимо выбрать пункт «Open PDF», который расположен на панели инструментов утилиты FreeOCR.

Чтобы загрузить документ из сканера необходимо нажать «Scan». В открывшемся окне пользователям приложения следует выполнить следующие действия:

  1. Выбрать устройство для сканирования.
  2. Установить режим цвета: черно-белый или цветной.
  3. Определить размер страницы.

После того, как документ будет загружен в программу, необходимо запустить процесс распознавания текста. Для этого используется функция «OCR» на панели инструментов.

На выбор доступно два варианта выполнения задачи: распознавание текущей страницы и распознавание всех страниц документа.

Для распознавания текста используется движок Tesseract. Благодаря этому повышается точность анализа текста. Процесс распознавания текстов запускается без использования дополнительных инструментов по выделению отдельных зон документа. Итоговый результат отобразится в правом окне интерфейса утилиты FreeOCR.

Преимущества:

  • бесплатная модель распространения;
  • мощный движок Tesseract для распознавания текста;
  • работа со всеми популярными форматами изображений;
  • можно загрузить файлы из сканера.

Недостатки FreeOCR:

  • нет официальной поддержки русского языка.

Распознавание рукописного текста MyScript Stylus

Разработчик: Vision Objects
Тип лицензии: trial на 30 дней
Требования: Windows, Mac или Linux, 400 Мб свободного места

MyScript Stylus — программа для распознавания рукописного текста. Текст можно вводить при помощи мыши или планшета. Программа распознает текст по технологии, применяющейся в кпк, и может использоваться там, где нет возможности использовать стандартную клавиатуру или ее использование затруднено (например, если компьютер используется как терминал для ввода/вывода информации, как платежный терминал). Вы можете закрепить MyScript Stylus за определенной программой, и весь распознаваемый текст будет передаваться ей, как-будто текст вводится стандартным способом. MyScript Stylus поддерживает 26 языков. Подробнее о MyScript Stylus ?

Скачать MyScript Stylus