Google je otvorio API za OCR
Web Usluge / / December 24, 2019
Da, oni rade u Google Knjige sigurno donijeti dobre rezultate, možemo početi žeti. A sada ću vam reći kako.
Skenirani dokumenti ne uvijek zahtijevaju transformaciju u stvarni tekst. Ali ponekad želi opet ne dobije nikakav dogovor, a elektronički primjerak nešto i ne. Naravno, možete koristiti neki jeftini programa OCR, ide uz skener, ili čak i kupiti ga (vas ne kradu) FineReader. Ali s desktop OCR softver radi i zato sada tekstovi sve su se fotografirali, nije skeniran.
Za preuzimanje bilo koje slike (JPEG, PNG, GIF) s prepoznavanje teksta za naknadne Google API-ja i otvoren je u Google dokumentima. Sada možete uploadati slike na biblioteku dokumenata, a Google poslužitelj će ga pretvoriti u tekst.
Tu je i aplikacija primjer koji pokazuje kako se API:
Ali ti, programeri bi trebali razmišljati o stvaranju vlastiti sučelje tim mogućnostima. Na primjer - da li vi imati skeniranje knjiga u PNG? To je perverzija, zar ne? Tako da imate karticu u ruci - napisati program koji učitava tekst stranicu po stranicu, ne krši granice i povezuje cijeli teret u jednom tekstu.
Ali zapamtite, postoje ograničenja u API, a glavni od njih, čini mi se - nešto što se priznaje samo latinski čim njega. Isto tako mora se voditi računa da visina znakova nije manja od 10 piksela, a ukupna veličina slike ne prelazi 10 megapiksela.