Подчас мы все попадаем в ситуацию, когда нужно извлечь текст из картинки. Казалось бы, это дело не сложное: забиваешь в гугл запрос и открываешь первую ссылку на сайт сервиса-конвертора. Но все не так просто. Для того, чтобы найти свой идеальный преобразователь пришлось покопаться. В итоге же я нашла его: сайт Free Online OCR Service ([ссылка]).
Зачем мне понадобился сервис-конвертор?
Заинтересовавшись серией Tony Moly Goat's Milk, я попросила у администрации магазинчика sweetness. com состав их пенки для умывания и увлажняющего тоннера. Админы прислали мне фото составы с коробки.
Запрос на фото составов косметики
Чтобы разобраться в том, насколько состав безопасный, человек без образования химика вынужден прибегать к помощи таких сайтов, как [ссылка]. Этот сервис позволяет ввести список ингредиентов косметической продукции, анализирует их и выдает рейтинг безопасности, что, на мой взгляд очень удобно.
Единственным "но" стал тот момент, что в форму на сайте нужно вводить текст, а у меня имеются только фотографические изображения. Переписывать все от руки было лениво и муторно. Вот я и отправилась на поиски сервиса, который распознает текст на файлах типа JPG, PDF и проч., и преобразовывает его в формат TXT, RTF, DOX и так далее.
Почему он?
Открыв несколько первых ссылок в топе поисковика, я столкнулась с тем, что на одних сервисах неудобный интерфейс, на других конвертация JPG-файла недоступна, на третьих она занимает вечность.
А вот сайт Free Online OCR Service покорил меня с первых минут: лаконичный дизайн, удобный, интуитивно понятный интерфейс и, что самое главное, очень шустрый!
Что такое ORC?
Вот что пишут во вкладке "About" сами разработчики сервиса:
OnlineOCR.net это бесплатный интернет-сервис по Оптическому Распознаванию Букв, который позволяет конвертировать отсканированные текстовые документы, факсы и фото в электронные документы с возможностью редактирования текста.
Работа с сервисом не требует регистрации и очень проста. Каждый юзер сети может воспользоваться услугой OCR. Но для зарегистрированных пользователей сервис предоставляет дополнительный набор опций:
распознавание больших изображений
архивирование в ZIP
выбор рабочих языков для распознавания
конвертация в форматы документов, допускающих редактирование
автоматический поворот изображений
и т.д.
Что делала я?
Я проверяла работу сервиса в режиме конвертации фала JPG в DOСX.
Как использовать ORC?
Как я уже говорила, у OCR Service очень удобный и понятный интерфейс. Поэтому работать с ним может даже "чайник".
Для конвертации фото в текст я прошла несколько несложных шагов:
Нажала кнопку Select file ("Выбрать файл").
Выбрала необходимый файл.
Дождалась, пока система его загрузит (индикатором служит длинная синяя полоса).
Выбрала язык документа (кстати, OCR поддерживает аж 46 языков мира).
Выбрала формат файла, в который я хочу конвертировать изображение (три формата на выбор).
Ввела капчу.
Нажала кнопку Convert ("Конвертировать").
И все! Буквально за пару секунд программа обработала изображение и в появившемся внизу экрана поле выдала текстовый формат того, что было на изображении. Без непонятных закарлючек, пробелов и прочей "радости".
Хотя, если Вы пытаетесь перевести в редактируемый формат текст с поверхности банки от крема, могут быть пробелы и непонятные смешения полусжеванных слов. Да и с коробочками он не особо дружит: сравните сконвертированный программой текст
В случае с первой цитатой мне стало лень подчеркивать все ляпы конвертации текста. Однако, если текст хорошо отсканирован и не имеет водяных знаков, он отлично конвертируется без ошибок.
Подводя черту
Сервис очень полезный, удобный. Значительно упрощает работу с текстами. Но, как и любой автомат по работе с текстами, от идеала пока еще немного далек. Пожалуй, к счастью для нас))