Сервисы для распознавания текста (обзор 14 ocr)
Содержание:
- Handy Scanner – простой и удобный сканер документов
- Распознаем текст на фото онлайн
- Программы для распознавания текста с картинки
- WinScan2PDF
- Scan Master – сканер документов с самым удобный интерфейсом
- Распознавание текста онлайн без регистрации
- OCR с использованием Microsoft OneNote
- Документы Google
- И тут я решил получше разглядеть ELMA RPA, которую я уже изучал ранее.
- Веб-сервис Free-OCR.com
- Выбор
- rite Pen
- Readiris Pro
- WinScan2PDF
- Как перенести текст с фото в Word онлайн: 5 сервисов
- Что делать с рукописным вводом?
- SimpleOCR
- Извлечение текста с помощью OneNote
- OCR Cunei Form
- Копирование текста с картинки в Интернет браузере
- Вывод
Handy Scanner – простой и удобный сканер документов
Приложение Handy Scanner отличается едва ли не более простым интерфейсом, чем предыдущее. Но при этом данный сканер обладает неплохими возможностями для создания многостраничных документов в бытовых условиях.
К сожалению, бесплатная версия имеет некоторые ограничения. Во-первых, максимальное количество документов составляет всего 20, по 5 страниц в каждом. Пакетная съемка ограничена тремя кадрами подряд. Реклама. Низкое и среднее качество изображения, а также отсутствие некоторых настроек при улучшении. Наконец, на PDF накладывается водяной знак.
Итак, приступаем к съемке. Используется собственный интерфейс для камеры, звук щелчка затвора присутствует. В настройках – включение вспышки, сетка и уровень. Возможна пакетная съемка, впоследствии обработка каждого фото выполняется отдельно.
Автоматическое определение границ срабатывает отлично, наше вмешательство минимально. Следующий шаг – улучшение, доступно шесть режимов. Напомним, что предусмотрены дополнительные настройки, но только для платной версии. После завершения редактирования изображение помещается в уже существующий или новый документ.
Также хочется заглянуть в настройки самого приложения. Полученные снимки можно автоматически сохранять в хранилище Dropbox или Google Drive, используя любое подключение или только Wi-Fi. При желании можно использовать системную камеру, отключить определение углов и фильтры, задать ориентацию страницы и ее размер.
В заключение хочется отметить быструю работу приложения и его качество в целом. Несмотря на скромный вид, Handy Scanner отлично справляется со своей задачей.
Распознаем текст на фото онлайн
Как уже было сказано выше, сканирование изображений может производиться через специальные программы. Полные инструкции по этой теме смотрите в отдельных наших материалах по следующим ссылкам
Сегодня же мы хотим акцентировать внимание на онлайн-сервисах, ведь в некоторых случаях они являются гораздо удобнее софта
Подробнее:Лучшие программы для распознавания текстаПреобразование изображения JPEG в текст в MS WordРаспознавание текста с картинки при помощи программы ABBYY FineReader
Способ 1: IMG2TXT
Первым на очереди выступит сайт под названием IMG2TXT. Основная его функциональность как раз и заключается в распознавании текста из изображений, и он отлично с этим справляется. Загрузить файл и провести его обработку вы можете следующим образом:
- Откройте главную страниц IMG2TXT и выберите подходящий язык интерфейса.
Приступайте к загрузке картинки для сканирования.
В обозревателе Windows выделите необходимый объект, а затем нажмите на «Открыть».
Укажите язык надписей на фотографии, чтобы сервис смог распознать их и перевести.
Запустите процесс обработки, щелкнув на соответствующей кнопке.
Каждый загруженный на сайт элемент обрабатывается по очереди, поэтому придется немного подождать.
После обновления страницы вы получите результат в виде текста. Его можно редактировать или скопировать.
Опуститесь немного ниже по вкладке — там находятся дополнительные инструменты, позволяющие перевести текст, скопировать его, проверить орфографию или скачать на компьютер в виде документа.
Теперь вы знаете, как через сайт IMG2TXT можно быстро и легко сканировать фотографии и работать с найденным на них текстом. Если данный вариант по каким-либо причинам вам не подходит, советуем ознакомиться со следующим методом.
Способ 2: ABBYY FineReader Online
У компании ABBYY есть собственный интернет-ресурс, позволяющий без предварительного скачивания программного обеспечения провести онлайн-распознавание текста из картинки. Осуществляется эта процедура достаточно просто, буквально в несколько шагов:
- Перейдите на сайт ABBYY FineReader Online, воспользовавшись указанной выше ссылкой и приступайте к работе с ним.
Кликните на «Загрузить файлы», чтобы добавить их.
Как и в предыдущем способе, вам нужно выбрать объект и открыть его.
Веб-ресурс может обработать несколько изображений за один раз, поэтому список всех добавленных элементов отображается под кнопкой «Загрузить файлы».
Вторым шагом является выбор языка надписей на фотографиях. Если их несколько, оставьте нужное количество вариантов, а лишнее удалите.
Осталось только выбрать конечный формат документа, в котором будет сохранен найденный текст.
Отметьте галочками пункты «Экспортировать результат в хранилище» и «Создать один файл для всех страниц», если это требуется.
Кнопка «Распознать» появится только после того, как вы пройдете процедуру регистрации на сайте.
Войдите с помощью доступных социальных сетей или создайте аккаунт через электронную почту.
Нажмите на «Распознать».
Ожидайте завершения обработки.
Щелкните на названии документа, чтобы началось его скачивание на компьютер.
Кроме этого вам доступен экспорт результата в онлайн-хранилища.
Обычно распознавание надписей в использованных сегодня онлайн-сервисах происходит без проблем, главным условием является только его нормальное отображение на фотографии, чтобы инструмент смог прочесть необходимые символы. В противном случае вам придется вручную разбирать надписи и перепечатывать их в текстовый вариант.
Опишите, что у вас не получилось.
Наши специалисты постараются ответить максимально быстро.
Программы для распознавания текста с картинки
OCR CuneiForm. Это открытая система оптического преобразования сканированных документов. Особенностью программы является то, что в ней можно распознавать в печатные страницы с одновременным использованием разных языков. Скачать OCR CuneiForm можно бесплатно на официальном сайте компании. Процесс установки на ПК стандартный.
Рабочее пространство довольно удобно, а интерфейс, представленный на русском языке, интуитивно понятен. Недостатком OCR CuneiForm является то, что разноцветные надписи практически не выводятся, а если черно-белое изображение плохого качества, результат получится с большим количеством ошибок.
RiDoc. Программа качается на ПК бесплатно, однако пользоваться основными функциями можно только в течение 30 дней. Далее необходимо платить. RiDoc удобен в использовании и имеет большой инструментарий для получения качественного результата. Чтобы преобразовать, необходимо нажать на кнопку «Открыть», загрузить документ и начать процесс. Результат можно загрузить в документ Word.
ABBYY FineReader. На сегодняшний день это наиболее популярная и раскрученная российская программа, распознающая текст с картинки. Для удобства пользователей здесь предусмотрен бесплатный тестовый период. Полная подписка стоит 7 тысяч рублей. Отличительной чертой является то, что с ее помощью можно преобразовывать таблицы и математические формулы, конвертируя данные в документы различных форматов.
WinScan2PDF
Winscan2pdf — это даже не полноценная программа, а утилита. Установка не потребуется, а исполнительный файл весит всего в несколько килобайт.
Процесс распознавания происходит предельно быстро, правда, полученные в его результате документы сохраняются исключительно в формате PDF.
Фактически весь процесс выполняется при нажатии трех кнопок: выбор источника, места назначения и, собственно, запуска программы.
Утилита предназначена для быстрой пакетной обработки множества файлов. Для удобства пользователей предусмотрен большой языковой пакет интерфейса.
Достоинства:
- портативность;
- быстрая работа;
- простота в использовании.
Недостатки:
- минимальный размер;
- единственный формат файлов на выходе.
Scan Master – сканер документов с самым удобный интерфейсом
Scan Master — скорее красивое, чем функциональное приложение. Отличный пользовательский интерфейс, удобный просмотр документов по тэгам сопровождается малым количеством режимов по улучшению изображения и, как ни странно, полным отсутствием настроек.
Для того чтобы открыть список тэгов, следует провести пальцем по экрану справа налево. После нажатия кнопки настроек можно изменить порядок тэгов, добавить новые или удалить существующие. По такому же принципу работает и CamScanner, на практике это очень удобно.
Переходим к сканированию. Используется собственное приложение для камеры с поддержкой пакетного режима. Однако здесь есть небольшой нюанс: обработка выполняется только для одиночных фотографий. В пакетном режиме приложение просто «склеивает» несколько фотографий в один документ, пропуская шаги по обрезке и улучшению. Звук щелчка затвора присутствует.
После того, как было сделано одиночное фото, выполняется операция по обрезке с автоматическим определением углов. Точность не 100%, но все же достаточно высокая, чтобы это вызывало неудобства.
После обрезки нам доступна единственная операция по улучшению: настройка детализации, яркости и контраста. Этого может быть катастрофически мало, если в дальнейшем пользователь планирует работать с текстовыми документами и отправлять их на печать.
После завершения редактирования предлагается добавить новую страницу из галереи или при помощи камеры. Также можно определить новый порядок полученных страниц, удалить ненужные и создать файл формата PDF.
Однако если на экране телефона «сканы» выглядят как будто бы нормально, то при первом же взгляде на монитор компьютера, куда был отправлен документ, нас постигло сильнейшее разочарование. Качество изображения настолько низкое, что в дальнейшем использовании приложения просто нет смысла.
Однако нам очень хотелось бы, чтобы в следующих версиях этот «недочет» был исправлен, так как у Scan Master с такими внешними данными есть все шансы на успех.
Распознавание текста онлайн без регистрации
Online OCR
Online OCR http://www.onlineocr.net/ – единственный наряду с Abbyy Finereader сервис, который позволяет сохранять в выходном формате картинки вместе с текстом. Вот как выглядит распознанный вариант с выходным форматом Word:
Результат распознавания в Online OCR (ФИО и дата распознаны, но стерты вручную)
Входные форматы | PDF, TIF, JPEG, BMP, PCX, PNG, GIF |
Выходные форматы | Word, Excel, Adobe PDF, Text Plain |
Размер файла | До 5Мб без регистрации и до 100Мб с ней |
Ограничения | Распознает не более 15 картинок в час без регистрации |
Качество | Качество распознавания свидетельства инн оказалось хорошее. Примерно как у Abbyy Finereader – какие-то части документа лучше распознались тем сервисом, а какие-то – этим. |
Как пользоваться
- Загрузите файл (щелкните «Select File»)
- Выберите язык и выходной формат
- Введите капчу и щелкните «Convert»
Внизу появится ссылка на выходной файл (текст с картинками) и окно с текстовым содержимым
Free Online OCR
Free Online OCR https://www.newocr.com/ позволяет выделить часть изображения. Выдает результат в текстовом формате (картинки не сохраняются).
Входные форматы | PDF, DjVu JPEG, PNG, GIF, BMP, TIFF |
Выходные форматы | Text Plain (PDF и Word тоже можно загрузить, но внутри них все равно текст без форматирования и картинок). |
Размер файла | До 5Мб без регистрации и до 100Мб с ней |
Ограничения | Ограничения на количество нет |
Качество | Качество распознавания свидетельства инн плохое. |
Как пользоваться
- Выберите файл или вставьте url файла и щелкните «Preview» – картинка загрузится и появится в окне браузера
- Выберите область сканирования (можно оставить целиком как есть)
- Выберите языки, на которых написан текст на картинке и щелкните кнопку «OCR»
- Внизу появится окно с текстом
OCR Convert
OCR Convert http://www.ocrconvert.com/ txt
Входные форматы | Многостраничные PDF, JPG, PNG, BMP, GIF, TIFF |
Выходные форматы | Text Plain |
Размер файла | До 5Мб общий размер файлов за один раз. |
Ограничения | Одновременно до 5 файлов. Сколько угодно раз. |
Качество | Качество распознавания свидетельства инн среднее. (ФИО распознано частично). Лучше, чем Google, хуже, чем Finereader |
Как пользоваться
-
-
- Загрузите файл, выберите язык и щелкните кнопку «Process»
-
-
-
- Появится ссылка на файл с распознанным текстом
-
Free OCR
Free OCR www.free-ocr.com распознал документ хуже всех.
Входные форматы | PDF, JPG, PNG, BMP, GIF, TIFF |
Выходные форматы | Text Plain |
Размер файла | До 6Мб |
Ограничения | У PDF-файла распознается только первая страница |
Качество | Качество распознавания свидетельства инн низкое – правильно распознано только три слова. |
Как пользоваться
-
-
- Выберите файл
- Выберите языки на картинке
- Щелкните кнопку “Start”
-
I2OCR
I2OCR http://www.i2ocr.com/ неплохой сервис со средним качеством выходного файла. Отличается приятным дизайном, отсутствием ограничений на количество распознаваемых картинок. Но временами зависает.
Входные форматы | JPG, PNG, BMP, TIF, PBM, PGM, PPM |
Выходные форматы | Text Plain (PDF и Word тоже можно загрузить, но внутри них все равно текст без форматирования и картинок). |
Размер файла | До 10Мб |
Ограничения | нет |
Качество | Качество распознавания свидетельства инн среднее – сравнимо с OCR Convert.
Замечено, что сервис временами не работает. |
Как пользоваться
- Выберите язык
- Загрузите файл
- Введите капчу
- Щелкните кнопку «Extract text»
- По кнопке «Download» можно загрузить выходной файл в нужном формате
OCR с использованием Microsoft OneNote
Microsoft OneNote имеет расширенные функции распознавания текста, которые работают как с изображениями, так и с рукописными заметками.
- Перетащите отсканированное изображение или сохраненное изображение в OneNote. Вы также можете использовать OneNote для клип часть экрана или изображение в OneNote.
- Щелкните правой кнопкой мыши на вставленной картинке и выберите Копировать текст с картинки, Скопированный оптически распознанный текст попадает в буфер обмена, и теперь вы можете вставить его обратно в OneNote или в любую программу, например Word или Notepad.
OneNote также может извлечь текст из многостраничной распечатки одним щелчком мыши. Вставьте многостраничную распечатку в OneNote и затем щелкните правой кнопкой мыши на текущей выбранной странице.
- Нажмите Скопируйте текст с этой страницы распечатки захватить текст только с этой выбранной страницы.
- Нажмите Копировать текст со всех страниц распечатки скопировать текст со всех страниц одним снимком, как показано ниже.
Обратите внимание, что точность распознавания также зависит от качества фотографии. Вот почему оптическое распознавание рукописного ввода все еще немного нечетко для OneNote и другого программного обеспечения для распознавания текста на рынке
Тем не менее, это одна из ключевых функций в OneNote
13 лучших новых функций OneNote, которые вы еще не пробовали
13 лучших новых функций OneNote, которые вы еще не пробовалиMicrosoft добавила много новых привилегий в OneNote для Windows 10. Вот лучшие новые функции OnenNote в OneNote, которые вы, возможно, пропустили.
Прочитайте больше
Вы должны использовать при каждой возможности.
Хотите узнать, как OneNote сравнивается с платным программным обеспечением для распознавания текста? Прочитайте наше сравнение OneNote и OmniPage
Сравнение бесплатного и платного программного обеспечения для распознавания текста: сравнение Microsoft OneNote и Nuance OmniPage
Сравнение бесплатного и платного программного обеспечения для распознавания текста: сравнение Microsoft OneNote и Nuance OmniPageПрограммное обеспечение сканера OCR позволяет преобразовывать текст в изображениях или PDF-файлах в редактируемые текстовые документы. Достаточно ли хорош инструмент OCR, например OneNote? Давайте разберемся!
Прочитайте больше
,
Документы Google
Для тех, кто уже знаком с документами Google, можно использовать OCR, встроенный в Google Drive. Для достижения наилучших результатов шрифт должен быть установлен на Arial или Times New Roman. Можно улучшить результат, убедившись, что сканированное изображение имеет равномерное освещение и четкую контрастность. Фотоматериалы могут обрабатываться индивидуально в файлах: jpg, png, gif или в многостраничных документах PDF. Расширение поддерживает большинство языков.
У Google есть много обучающих программ и возможностей облачной обработки. Многие пользователи считают, что у сервиса нет достаточно продвинутых функций и опций. Тем не менее, если используется приложение Google Drive для Android, можно сканировать страницы прямо из приложения, используя камеру на смартфоне. В противном случае загружают документы с помощью сканера, подключенного к компьютеру, или любым другим способом, чтобы начать обработку распознавания в Google Диске. Для физических лиц на Google Диске предлагается бесплатный уровень хранения около 19 ГБ с возможностью расширения до 100 ГБ через Google One за 1,99 долл. США.
И тут я решил получше разглядеть ELMA RPA, которую я уже изучал ранее.
Распознавание по шаблону
- Этот вид распознавания работает именно со сканами формата jpg и png, pdf он пока не рассматривает. Но продукт еще молодой, думаю, все впереди.
- Этот вид распознавания входит в бесплатную версию Community Edition
- Удобно размечен текст по блокам, которые можно сопоставить, согласно переменным, которые мы создали в контексте робота. Таким образом вручную настроить, что именно тянем в распознавание.
- Нашу счет-фактуру он распознал 50/50, некоторые слова подменил как посчитал нужным. 🙂
другой вид распознавания — intellect labЧто отметил по поводу этого распознавания:
- Здесь уже распознавание работает как программа сканирования документов pdf, и при этом работает и с форматами jpg и png.
- Качество документа не влияет на эффективность распознавания. Даже документы с плохим качеством распознаются корректно.
- Счет-фактура распозналась полностью и без подмен переменных.
- Робот сумел получить скан с почты, распознать его и создать его экземпляр в 1С. То есть автоматически сохранил файл там, где мы ему задали, что, естественно, крайне удобно.
- Входит в бесплатную Community Edition в виде распознавания документа в облаке. Подходит, если используем стандартные типы (СФ, УПД, АВР и др.), и, например до 100 документов в месяц или до 500 в год. (Стоит заметить, что считаем не в страницах, а в документах непосредственно.)
- примерно 180 000 руб. единовременно,
- плюс, допустим, 400 000 руб. покупка робота с оркестратором
- итого: 580 000 руб.
- Можно настроить получение документов по событию, а также, например из электронной почты и любых других внешних источников. У меня пока была цель настроить получение с почты.
- Все считанные данные с документа можно спокойно записать в контекстные переменные и далее их передать в необходимые системы, приложения, сайты, ВМ и т д. И я не переписываю уже ничего руками.
- Скорость обработки. 15 секунд и объект распознан, а остальной порядок действий — это счет по минутам. Если заявиться с потоковым сканированием с большим количеством документов, думаю это не составит больших временных затрат.
- Много качественного функционала в свободном доступе, для небольших компаний им можно вполне обойтись.
Веб-сервис Free-OCR.com
Free-OCR.com (OCR — Optical character recognition, оптическое распознавание символов) — бесплатный Интернет-сервис для распознавания отсканированных или сфотографированных текстов, сохраненных в формате графического изображения (jpg, gif, tiff, bmp) или pdf. Поддерживает 29 языков, включая русский и украинский, причем пользователь может выбрать не один, а несколько, если их содержит исходный текст.
Free-OCR не требует регистрации и не имеет каких-либо ограничений по количеству загруженных документов. Ограничивается только размер файла — до 6 Mb. Многостраничные документы сервис не обрабатывает, точнее, игнорирует всё, кроме первого листа.
Скорость распознавания сканированного текста довольно высока. Лист А4 с фрагментом книги на русском языке был обработан примерно за 5 секунд, но вот качество не порадовало. Крупные шрифты — как в детских книжках, он распознает на 100%, а средние и мелкие — примерно на 80%. С англоязычными документами дела обстоят несколько лучше — мелкий и неконтрастный шрифт распознался правильно примерно на 95%.
Выбор
Как же выбрать наиболее подходящую программу, и какие основные особенности имеет такой софт?
Отличаться он может по разным показателям – точности распознавания, способности работать с тем или иным языком, возможности сохранять исходную структуру текста и т. п.
Такой софт может распространяться платно и бесплатно, и быть реализован как онлайн (в виде особых сервисов), так и в форме предустанавливаемых программ.
Алгоритм работы заключается в том, что для каждой буквы алфавита составляется база вариантов того, как она может выглядеть на фото, выделяются и сохраняются ее основные элементы. Как только такие элементы обнаруживаются на фото, программа распознает соответствующую букву. В зависимости от того, насколько качественно и подробно была составлена такая база, зависит качество распознавания материала в итоге.
Потому важно, чтобы софт был рассчитан на работу именно с русским языком (некоторые программы могут работать с текстом, написанным сразу на двух языках, другие – нет). Кроме того, некоторые утилиты и сервисы способны сохранять даже изначальную структуру текста (таблицы, списки), тип его оформления (отступы и т
п.) и даже шрифт
Кроме того, некоторые утилиты и сервисы способны сохранять даже изначальную структуру текста (таблицы, списки), тип его оформления (отступы и т. п.) и даже шрифт.
В каких же случаях такой софт необходим?
- При создании документов, когда имеется только распечатанный вариант;
- При составлении рефератов, докладов и необходимости процитировать в них большой отрывок текста из книги;
- Для редакторских работ, когда текст имеется лишь в формате фото и т. д.
На самом деле сфера использования софта очень велика, и правильно выбранный, он способен облегчить и ускорить работу с текстом.
rite Pen
Разработчик: | Evernote Corp. |
Тип лицензии: | trial на 30 дней |
rite Pen — программа для ускорения ввода текста в текстовые редакторы, формы, для быстрого заполнения форм и сохранения заметок. Вы можете вводить текст, просто рисуя рукописные символы при помощи мыши или планшета в любом месте экрана. Программа автоматически их распознает и введет в указанную программу или форму, или просто сохранит в своей базе данных. Вы также можете добавлять заметки прямо на экран, выделять области экрана, и сохранять их для дальнейшего использования. Еще одна полезная возможность — создание меток. Запрограммируйте определенное слово или рисунок (метку) за вводом определенного текста, и как только вы нарисуете эту метку на экране, тут же будет вставлен нужный текст. Подробнее о rite Pen ?
Readiris Pro
<�Рис. 5 Readiris Pro>
Readiris Pro – еще один платный софт, обеспечивающий достаточно разнообразную и стабильную работу по распознаванию и редактированию теста.
Имеет более узкий функционал по сравнения с первой программой в ТОПе, но и распространяется по более низкой цене.
Может работать с изображениями плохого качества, распознает различные, но не рукописные, шрифты.
Не способен выполнять перевод, а также сканировать документы напрямую в программу для дальнейшего распознавания – можно только добавлять по отдельности готовые файлы-картинки.
Позитив:
- Высокое качество распознавания материала;
- Достаточно значительная скорость работы;
- Способность сохранять структуру документа и распознавать шрифт, которым он напечатан.
Негатив:
- Отсутствие возможности прямого сканирования прямо в программу;
- Отсутствие встроенного переводчика;
- Программа не может работать с рукописным текстом.
WinScan2PDF
Это даже не полноценная программа, а утилита. Установка не потребуется, а исполнительный файл весит всего в несколько килобайт. Процесс распознавания происходит предельно быстро, правда, полученные в его результате документы сохраняются исключительно в формате PDF.
Фактически весь процесс выполняется при нажатии трех кнопок: выбор источника, места назначения и, собственно, запуска программы.
Утилита предназначена для быстрой пакетной обработки множества файлов. Для удобства пользователей предусмотрен большой языковой пакет интерфейса.
Достоинства:
- портативность;
- быстрая работа;
- простота в использовании.
Недостатки:
- минимальный размер;
- единственный формат файлов на выходе.
Как перенести текст с фото в Word онлайн: 5 сервисов
Прибегают к ним, как правило, для переноса текста с фото в Word в небольших объемах, а также тогда, когда операция носит разовый характер. Подавляющее большинство таких сервисов являются условно-бесплатными, при этом в бесплатном режиме они ограничивают функционал — устанавливают лимиты на объем текста, количество языков, требуют обязательной регистрации и так далее.
Convertio
Хороший сервис для перевода текста с фото в Word, понимает несколько десятков языков, работает с PDF и популярными форматами растровых изображений, позволяет сканировать до 10 страниц в бесплатном режиме. Результат сканирования может быть сохранен в 9 форматов, включая Word.
- На странице сервиса нажмите «Выберите файлы» и укажите изображение на диске. Можно последовательно добавить еще 9 файлов;
- Укажите распознаваемый язык (по умолчанию русский) и формат сохранения;
- Нажмите «Распознать», а затем появившуюся чуть выше кнопку «Скачать».
- Не требует обязательной регистрации.
- Загрузка с Dropbox, Google Drive и по URL.
Плохо работает с изображениями с многоцветным фоном.
Img2txt
Бесплатный онлайн-сканер текста с фото для Word, поддерживает работу с растровыми изображениями и PDF-документами размером не более 8 Мб.
- Выберите файл нажатием одноименной кнопки;
- Укажите язык распознаваемого текста;
- Нажмите «Загрузить» и дождитесь результата;
- Прокрутите страницу немного вниз, нажмите «Скачать» и укажите формат Word.
- Совершенно бесплатен и не требует регистрации.
- Предпросмотр результатов конвертации текста с фото в Word.
- Может распознавать текст даже из картинок с цветным фоном, но не исключены и ошибки.
Размер фото не должен превышать 8 Мб.
Online OCR
Этот бесплатный сервис позиционируется как конвертер PDF в Word с оптическим распознаванием, но с таким же успехом он может быть использован как преобразователь текста с фото в Word в режиме онлайн. Без регистрации позволяет вытащить из фото текст в Word до 15 раз в час.
- Нажмите кнопку «Файл» и выберите на жестком диске фото;
- Укажите язык распознавания и выходной формат файла DOСX;
- Нажмите «Конвертировать», отредактируйте, если потребуется, текст в поле предпросмотра и скачайте выходной файл.
- Регистрироваться необязательно.
- Распознаёт текст с картинок с цветным фоном с выводом в область предпросмотра.
- Поддерживает распознавание текста с фото в Word в пакетном режиме.
- При извлечении текста из цветного фото текст иногда приходится копировать из области предпросмотра, так как при сохранении даже хорошо распознанного текста в Word в файл вставляется картинка-исходник.
- Разрешение картинки должно быть не менее 200 DPI, в противном случает текст будет содержать много ошибок.
Free Online OCR
Неказистый на вид, но достаточно неплохой англоязычный сервис, позволяющий распознать текст с фото в Word онлайн. В отличие от аналогичных ресурсов, Free Online OCR умеет автоматически определять язык текста на изображении, поддерживается добавление дополнительных локализаций на случай, если фото содержит текст двух языков. Из дополнительных возможностей стоит отметить поворот картинки на 180°, 90° вправо/влево, а также разделение многоколоночного текста на столбцы.
- Нажмите кнопку выбора файла, а когда его имя появится рядом с кнопкой, нажмите «Preview»;
- Убедитесь, что программа точно определила язык, если нужно, добавьте кликом по полю «Recognition language(s) (you can select multiple)» второй язык.
- Нажмите кнопку «OCR» для запуска процедуры распознавания.
- Проверьте корректность распознавания, в меню выберите Download → DOC.
- Прост и удобен.
- Наличие дополнительных опций.
- Имеется возможность выбрать конкретный участок изображения.
- Нет поддержки пакетного режима.
- Иногда игнорирует второй язык.
- Не поддерживает конвертирование в DOCX.
ABBYY FineReader Online
Наиболее известный и качественный сервис, позволяющий выполнить распознавание текста с фото в Word онлайн. Отличается функциональностью, поддержкой множества языков и девяти форматов, загрузкой файлов с облачных хранилищ, а также сохранением результатов в облачные хранилища.
- Зайдите на сервис с помощью учетной записи Facebook, Google или Microsoft;
- Нажатием одноименной кнопки загрузите изображения с текстом;
- Выберите язык документа и формат сохранения;
- Нажмите «Распознать»;
- Скачайте готовый файл на следующей странице.
- Отличное качество распознавания.
- Пакетный режим.
- Требуется обязательная регистрация.
- В бесплатном режиме можно обработать не более 12 документов.
- Текст в документах Word может нуждаться в дополнительном форматировании.
Что делать с рукописным вводом?
Человек способен догадаться о смысле предложения, даже если оно написано самым неразборчивым почерком (если речь не идет о рецепте на лекарства, конечно).
Задачу для компьютера иногда упрощают. Например, людей просят писать почтовый индекс в специальном месте на конверте специальным шрифтом. Формы, созданные для дальнейшей обработки компьютером, обычно имеют отдельные поля, которые просят заполнять печатными буквами.
Планшеты и смартфоны, которые поддерживают рукописный ввод, часто используют принцип выявления признаков. При написании буквы «А» экран «чувствует», что сначала пользователь написал одну линию под углом, затем вторую, и, наконец, провел горизонтальную черту между ними. Компьютеру помогает то, что все признаки появляются последовательно, один за другим, в отличие от варианта, когда весь текст уже записан от руки на бумаге.
SimpleOCR
Трудность, с которой я столкнулся при распознавании рукописного ввода с использованием инструментов MS, могла бы найти решение в SimpleOCR. Но программное обеспечение предлагает распознавание рукописного ввода только в качестве 14-дневной бесплатной пробной версии. Хотя машинное распознавание печати не есть какие-то ограничения.
Программное обеспечение выглядит устаревшим, поскольку оно не обновлялось с версии 3.1, но вы все равно можете попробовать его из-за его простоты.
- Настройте его для чтения непосредственно со сканера или путем добавления страницы (JPG, TIFF, BMP форматы).
- SimpleOCR предлагает некоторый контроль над преобразованием посредством выделения текста, выбора изображения и функций игнорирования текста.
- Преобразование в текст берет процесс в этап проверки; пользователь может исправить несоответствия в преобразованном тексте, используя встроенную проверку орфографии.
- Преобразованный файл может быть сохранен в формате DOC или TXT.
SimpleOCR был в порядке с обычным текстом, но его обработка многостолбцовых макетов была разочарованием. На мой взгляд, точность преобразования инструментов Microsoft была значительно выше, чем у SimpleOCR.
Скачать: SimpleOCR для Windows (бесплатно, платно)
Извлечение текста с помощью OneNote
OneNote OCR уже на протяжении нескольких лет остается одной из самых лучших программ для распознавания текста. Однако, распознавание это одна из тех менее известных функций, которые пользователи редко используют, но как только вы начнете ее использовать, вы будете удивлены тем, насколько быстрой и точной она может быть. Действительно, способность извлекать текст — одна из особенностей, которая делает OneNote лучше Evernote.
Это стандартная программа, скорее всего вам не придется устанавливать ее самостоятельно. Найдите ее на компьютере в папке Microsoft Office или же с помощью поиска на панели «Пуск». Запустите программу.
Инструкции по извлечению текста:
-
Шаг 1. Откройте любую страницу в OneNote, желательно пустую.
Открываем любую страницу в OneNote
-
Шаг 2. Перейдите в меню «Вставка»> «Изображения» и выберите файл изображения и настройте язык распознавания.
Выберите файл изображения
- Шаг 3. Щелкните правой кнопкой мыши по вставленному изображению и выберите «Копировать текст с изображения». Он сохранится в буфере обмена.
Копируем текст с изображения
Теперь вы можете вставить его куда угодно. Удалите вставленное изображение, если оно вам больше не нужно.
Вставляем текст куда угодно
OCR Cunei Form
<�Рис. 4 OCR Cunei Form>
OCR Cunei Form – пожалуй, одна из наиболее функциональных и удобных программ, среди тех, что распространяются бесплатно.
Обеспечивает достаточно высокое качество распознавания, работает даже с фотографиями плохого качества.
Программа позволяет редактировать фото прямо в процессе работы с ним, достаточно хорошо распознает шрифты и структуры (хотя и не работает с рукописным текстом).
Способна сканировать файлы напрямую, и отправлять их в редактор в текстовом виде.
Имеет достаточно удовлетворительную скорость работы.
Позитив:
- Высокое качество распознавания;
- Поддержка большого количества языков;
- Бесплатное распространение;
- Довольно высокая скорость работы.
Негатив:
- Отсутствие встроенного переводчика;
- Никое качество проверки на орфографию;
- Отсутствие возможности работы с рукописным текстом.
Копирование текста с картинки в Интернет браузере
Первый инструмент, о котором расскажем, будет плагин для браузера Google Chrome: Project Naptha. Это бесплатный и очень удобный плагин, который позволяет легко (без запуска других программ) в любое время скопировать информацию из графического изображения. Распознать текст с картинок и фотографий, сделанных в фотошопе.
После инсталляции (Меню… Дополнительные расширения… Расширения… Еще расширения… в поиске Project Naptha… Enter… Установка…), плагин будет все время активен и в документы на растровых образах.
Плагин распознает практически любой шрифт. К сожалению, есть один недостаток, не может справиться с некоторыми знаками. При копировании информации с некоторыми знаками, например «апостраф», может выскочить сообщение об ошибке.
Вывод
Если вы работаете с текстом постоянно и профессионально, то вам подойдет софт Abbyy Fine Reader.
Однако, если нужна именно бесплатная программа, то вполне удастся обойтись и OCR Cunei Form.
Для простой и быстрой работы со скриншотами скачайте Abbyy Screenshot Reader, но строго говоря, без этой программы вообще можно обойтись.
Если распознавание – только одна, и не самая частая задача при вашей работе с документами, то отдайте предпочтение многофункциональной Adobe Acrobat, способной заменить множество программ.
Если де необходимость в распознавании единична, то используйте Free Online OCR.