Възможността за извличане на текстове с онлайн OCR става необходима, когато по някаква причина в ръцете ни попадне изображение с включени в него текстове и трябва да бъде Ръчно преписване на съдържание в текстов документ. Благоприятно е, че тази ситуация може да бъде избегната с използването на това интересно уеб приложение.
Най-доброто от всичко е съвместимостта, която този инструмент предлага, тъй като извличането на текстове с Онлайн OCR Прилага се не само към изображения (с някакъв вид текст, включен в тях), но също така може да бъде използвайте същия инструмент за PDF файлове; В тази статия ще споменем и двата аспекта по игрив начин, където ще анализираме предимствата и недостатъците, които ни предлага уеб приложението, когато се занимаваме и с двата елемента.
Как да извличате текстове с онлайн OCR в изображения
За да постигнем това, ще предложим доста основен пример, в който ще се опитаме да намерим изображение, което се хоства в Интернет, което трябва да съдържа някакъв вид важна фраза, която може да се наложи да използваме.
- Можем да отворим нашия интернет браузър в първия случай (който може да бъде Google Chrome).
- Ние сме посветени на търсенето само на изображения.
- Опитваме се да намерим «най-добрите известни фрази".
- От получените резултати нека изтеглим един или повече (във последния случай можем да използваме съответния плъгин за изтегляне на партиди).
- Отиваме в нашето уеб приложение, за да извлечем текстове Онлайн OCR.
- В интерфейса на този инструмент избираме бутона «проучи".
- Кликваме върху «Качи".
- По-късно конфигурираме езика, на който се намира съдържанието (текста) в изображението, което сме изтеглили.
- Можем също да изберем изходния формат на текста, който ще бъде извлечен по този метод.
- Щракваме върху бутона Разпознавам и пишем знаците, предложени от Captcha.
След няколко секунди ще можем да се възхищаваме на резултата от това, което сме направили, когато се опитваме да извлечем текстове с Онлайн OCR приложени към изображения. Можем да заключим, че разпознаването е 90% ефективно, поради факта, че определени думи и букви не са напълно идентифицирани.
Това има обяснение, тъй като изображението, което сме избрали, използва специален шрифт, който при дефиниране на кръгли знаци може да бъде объркан един с друг в метода на разпознаване.
Извличайте текстове с онлайн OCR в PDF файлове
Процедурата е донякъде подобна на тази, която предложихме по-рано, въпреки че ако ще се опитаме да разпознаем цялото съдържание на PDF файл, може вече да го съхраняваме на нашия компютър. Тук има 2 фактора за анализ, като единият от тях е, че се обмисля PDF файл, в който има изображения, конвертирани в този тип формат, където със сигурност ще получим като резултат ефективност, много подобна на процедурата, която изпълнихме преди.
Но ако PDF документът има текст, който може да бъде избегнат (с някакво специализирано приложение, като напр PDF писател), тогава разпознаването ще бъде по-ефективно от това, което е показано на изображенията, тъй като буквите (или всеки знак, поставен в PDF файла) съществуват и не изискват преструктуриране, за да бъдат разпознати по този метод.
Сега, въпреки че това приложение за извличане на текстове с Онлайн OCR Показва се като напълно безплатна услуга, ситуацията се усложнява, ако PDF файлът ни съдържа голям брой страници; Въпреки че можете да изтеглите цялото съдържание, генерирано с помощта на този инструмент, в долната част се появява предупредителен прозорец, където потребителят на услугата е информиран, че Необходима е регистрация за достъп до повече функции и с това използвайте разпознаване за значително големи изображения, PDF файлове с голям брой страници, използвайте голямо разнообразие от езици сред много други алтернативи.
Повече информация - Преглед: Как лесно да изтегляте изображения с Image Downloader, Създавайте и редактирайте PDF файлове в Windows 8 с Drawboard
Уеб - онлайнокр