Опубликовано 9 Декабрь, 2015 - 13:42

Подчас мы все попадаем в ситуацию, когда нужно извлечь текст из картинки. Казалось бы, это дело не сложное: забиваешь в гугл запрос и открываешь первую ссылку на сайт сервиса-конвертора. Но все не так просто. Для того, чтобы найти свой идеальный преобразователь пришлось покопаться. В итоге же я нашла его: сайт Free Online OCR Service ([ссылка]).

Зачем мне понадобился сервис-конвертор?

Заинтересовавшись серией Tony Moly Goat's Milk, я попросила у администрации магазинчика sweetness. com состав их пенки для умывания и увлажняющего тоннера. Админы прислали мне фото составы с коробки.

Запрос на фото составов косметики

Чтобы разобраться в том, насколько состав безопасный, человек без образования химика вынужден прибегать к помощи таких сайтов, как [ссылка]. Этот сервис позволяет ввести список ингредиентов косметической продукции, анализирует их и выдает рейтинг безопасности, что, на мой взгляд очень удобно.

Единственным "но" стал тот момент, что в форму на сайте нужно вводить текст, а у меня имеются только фотографические изображения. Переписывать все от руки было лениво и муторно. Вот я и отправилась на поиски сервиса, который распознает текст на файлах типа JPG, PDF и проч., и преобразовывает его в формат TXT, RTF, DOX и так далее.

Почему он?

Открыв несколько первых ссылок в топе поисковика, я столкнулась с тем, что на одних сервисах неудобный интерфейс, на других конвертация JPG-файла недоступна, на третьих она занимает вечность.

А вот сайт Free Online OCR Service покорил меня с первых минут: лаконичный дизайн, удобный, интуитивно понятный интерфейс и, что самое главное, очень шустрый!

Что такое ORC?

Вот что пишут во вкладке "About" сами разработчики сервиса:

OnlineOCR.net это бесплатный интернет-сервис по Оптическому Распознаванию Букв, который позволяет конвертировать отсканированные текстовые документы, факсы и фото в электронные документы с возможностью редактирования текста.

Работа с сервисом не требует регистрации и очень проста. Каждый юзер сети может воспользоваться услугой OCR. Но для зарегистрированных пользователей сервис предоставляет дополнительный набор опций:

  • распознавание больших изображений

  • архивирование в ZIP

  • выбор рабочих языков для распознавания

  • конвертация в форматы документов, допускающих редактирование

  • автоматический поворот изображений

  • и т.д.

Что делала я?

Я проверяла работу сервиса в режиме конвертации фала JPG в DOСX.

Как использовать ORC?

Как я уже говорила, у OCR Service очень удобный и понятный интерфейс. Поэтому работать с ним может даже "чайник".

Для конвертации фото в текст я прошла несколько несложных шагов:

  1. Нажала кнопку Select file ("Выбрать файл").
  2. Выбрала необходимый файл.
  3. Дождалась, пока система его загрузит (индикатором служит длинная синяя полоса).
  4. Выбрала язык документа (кстати, OCR поддерживает аж 46 языков мира).
  5. Выбрала формат файла, в который я хочу конвертировать изображение (три формата на выбор).
  6. Ввела капчу.
  7. Нажала кнопку Convert ("Конвертировать").

И все! Буквально за пару секунд программа обработала изображение и в появившемся внизу экрана поле выдала текстовый формат того, что было на изображении. Без непонятных закарлючек, пробелов и прочей "радости".

Хотя, если Вы пытаетесь перевести в редактируемый формат текст с поверхности банки от крема, могут быть пробелы и непонятные смешения полусжеванных слов. Да и с коробочками он не особо дружит: сравните сконвертированный программой текст

Water, Glycerin, Myristic Add, Lauric add, PEG-32, Potassium Hydroxide, Pahitc Aod, Gyceryi Stearate. Propylene Glycol, Steatic Acid, Cocarndo-propyt Seta:ie. Goat Mac Extract, Poloxarner 184, Olive Oi PEG-8 Esters, PEG-100 Stearate, Cerarride 3. Hy droiyzed Hyaloons Acid, Lecithit Butylene Glynn( Polysabate 80, Scdern Ascctbyl Phosphate, Antiodp nins, Lauranide DEA, Sodium CMoride, Pclyqualerniu m-7, (vie Acid, /vactictic Add, AoyetridoprOgytn-mOrOurn Chistide/Aaylarride Copolymer, Disodurn ED TA, Phenoxyethanc1, Chlorphenesin. Came" Glycol, Ethyhexytgycerin. Fragance

и мой вручную отредактированный текст

Water, Glycerin, Myristic Acid, Lauric acid, PEG-32, Potassium Hydroxide, Palmitic Acid, Gyceryl Stearate, Propylene Glycol, Stearic Acid, Cocamidopropyl betaine, Goat Milk Extract, Poloxarner 184, Olive Oil PEG-8 Esters, PEG-100 Stearate, Cerramide 3, Hyalronic Acid, Lecitin, Butylene Glycol, Polysorbate 80, Sodium Ascorbyl Phosphate, Anthocyanins, Lauramide DEA, Sodium Chloride, Polyquaternium-7, Capric Acid, Arachidic Acid, Acrylamidopropyltrimonium chloride, Acrylamide Copolymer, Disodium ED TA, Phenoxyethanol, Chlorphenesin, Caprylyl Glycol, Ethylhexylglycerin, Fragance

В случае с первой цитатой мне стало лень подчеркивать все ляпы конвертации текста. Однако, если текст хорошо отсканирован и не имеет водяных знаков, он отлично конвертируется без ошибок.

Подводя черту

Сервис очень полезный, удобный. Значительно упрощает работу с текстами. Но, как и любой автомат по работе с текстами, от идеала пока еще немного далек. Пожалуй, к счастью для нас))

Сервис OCR Рекомендую!

Достоинства
  • Бесплатный
  • Быстрый
  • Доступен без регистрации
  • Многоязыковой
  • С дружественным интерфейсом
  • Удобный
  • Эффективный
Недостатки
  • Не всегда правильно распознает нечеткий текст
Koreрекомендует
Читать все отзывы 1
Comments.
Все комментарии
Авторизуйтесь для комментирования
Оставить комментарий
Смотрите также