Mogućnost izdvajanja tekstova online OCR-om postaje neophodna kada nam iz nekog razloga dođe u ruke slika sa tekstovima koji su u njoj uključeni, a ona mora biti Ručno prepišite sadržaj u tekstualni dokument. Prednost je da se ova situacija može izbjeći korištenjem ove zanimljive web aplikacije.
Najbolja od svega je kompatibilnost koju ovaj alat nudi, jer izdvajanje tekstova sa OCR na mreži Ne primjenjuje se samo na slike (sa nekim tipom teksta uključenog u njih), već se također može primijeniti koristite isti alat za PDF datoteke; U ovom članku ćemo na razigran način spomenuti oba aspekta, gdje ćemo analizirati prednosti i nedostatke koje nam web aplikacija nudi kada se bavimo oba elementa.
Kako izdvojiti tekstove pomoću Online OCR-a u slikama
Da bismo to postigli, predložit ćemo prilično osnovni primjer, u kojem ćemo pokušati pronaći sliku koja se nalazi na internetu, a koja bi trebala sadržavati neku vrstu važne fraze koju ćemo možda morati koristiti.
- Mogli bismo prvo otvoriti naš internet pretraživač (što bi mogao biti Google Chrome).
- Posvećeni smo traženju samo slika.
- Trudimo se da pronađemo «najbolje poznate fraze".
- Iz dobijenih rezultata, hajde da preuzmemo jedan ili više (u drugom slučaju, mogli bismo koristiti odgovarajući dodatak za preuzimanje u serijama).
- Idemo u našu web aplikaciju da izvučemo tekstove OCR na mreži.
- U interfejsu ovog alata biramo dugme «Ispitajte".
- Kliknemo na dugme «upload".
- Kasnije konfigurišemo jezik na kojem se nalazi sadržaj (tekst) unutar slike koju smo preuzeli.
- Također možemo odabrati izlazni format teksta koji će biti ekstrahovan ovom metodom.
- Kliknemo na dugme prepoznati i pišemo znakove koje je predložio Captcha.
Nakon nekoliko sekundi moći ćemo da se divimo rezultatu onoga što smo uradili, ovo kada pokušamo da izvučemo tekstove sa OCR na mreži primijenjen na slike. Možemo zaključiti da je prepoznavanje efektivno 90% zbog činjenice da određene riječi i slova nisu u potpunosti identificirani.
Ovo ima objašnjenje, jer slika koju smo odabrali koristi poseban font, koji se prilikom definiranja okruglih znakova može pomiješati jedan s drugim u metodi prepoznavanja.
Izdvojite tekstove s online OCR-om u PDF datoteke
Procedura je donekle slična onoj koju smo prethodno predložili, iako ako ćemo pokušati prepoznati sav sadržaj PDF datoteke, možda ga već imamo pohranjenog na našem računalu. Ovdje postoje 2 faktora za analizu, jedan od njih je da se razmatra PDF datoteka u kojoj se nalaze slike koje su konvertovane u ovu vrstu formata, gdje ćemo sigurno dobiti kao rezultat djelotvornost vrlo sličnu proceduri koju smo prethodno izvršili.
Ali ako PDF dokument ima tekst koji se može izbjeći (s nekom specijaliziranom aplikacijom kao što je PDF Writer), tada će prepoznavanje biti efikasnije od onoga što je prikazano na slikama, jer slova (ili svaki znak smješten u PDF datoteci) postoje i ne zahtijevaju restrukturiranje da bi se prepoznali prema ovoj metodi.
Sada, iako je ova aplikacija za izdvajanje tekstova sa OCR na mreži Prikazuje se kao potpuno besplatna usluga, situacija se zakomplicira ako naš PDF fajl sadrži veliki broj stranica; Iako možete preuzeti sav sadržaj generiran pomoću ovog alata, na dnu se pojavljuje prozor s upozorenjem u kojem se korisnik servisa obavještava da Za pristup više funkcija potrebna je registracija i uz to, koristite prepoznavanje za znatno velike slike, PDF datoteke s velikim brojem stranica, koristite širok izbor jezika među mnogim drugim alternativama.
Više informacija - Pregled: Kako lako preuzeti slike pomoću Image Downloader-a, kreirati i uređivati PDF datoteke u Windows 8 pomoću Drawboard-a
Web - onlineocr