Šta je OCR tehnologija?

Upotreba dokumenata u digitalnoj verziji sve se više koristi, a rad sa ovakvom vrstom dokumenata skraćuje poslovne procese i donosi uštede. Da bismo analogne verzije dokumenata uredili u digitalne verzije koristi se OCR tehnologija.

U ovom blogu želimo upravo to da vam predstavimo.

OCR je skraćenica od engleske riječi Optical Character Recognition, te predstavlja računarski softver koji je kreiran da prevodi sliku otisnutog teksta sa papira, a koja se obično učitava preko skenera u editabilni tekst, ili prevodi sliku sa znakovima u standardnu kodnu šemu, predstavljujući ih u ASCII ili Unicode kodu. OCR je polje istraživanja vještačke inteligencije i mašinskog učenja.

ASCII je standardni kod za razmjenu podataka, a čini ga skup karaktera tj. kodova koji se najčešće koriste u računarstvu, svoju primjenu ima u tehnologiji OCR-a. Osim brojeva, sva slova abecede, simboli i interpukcijski znakovi kao i razmak mogu se zapisati pomoću 0 i 1. Za kodiranje svih ovih znakova upravo se koristi ASCII.

Dok je Unicode standard za razmjenu podataka usmjeren na prikaz slova nezavisno od jezika, programskog jezika ili platforme.

OCR sistem je mehanička ili elektronska konverzija slika kucanog ili štampanog kao i pisanog teksta u editabilan oblik. Jednostavan primjer koji bi objasnio namjenu ovakvog softvera je da ga predstavimo kao biblioteku u kojoj su sve knjige u elektronskoj formi.

Ova tehnologija primjenjuje se u raznim oblastima kao na primjer: automatsko prepoznavanje registarskih tablica, očitavanja dokumenta kao što su pasoši, čekovi, priznanice, fakture itd.

ISTORIJSKI OSVRT

Želja za unapređenjem čovjekovog života uvijek je bila vodilja mnogih naučnika. Time su se vodili i stručnjaci u istoriji ove tehnologije, a počeci OCR tehnologije sežu još od davne 1870. godine. Upravo te godine je C.R. Carey sa Univerziteta Boston Masačusets izumio retinalni skener. To je bio sistem za prenos slika koji je sadržavao mozaik fotoćelija. Nakon dvije decenije P. Nipkow predstavio je sekvencijalni skener koji je posebno važan za modernu televiziju i mašine za čitanje.

Moderna verzija OCR-a nije se pojavila sve do sredine 40-ih godina prošlog vijeka, kada su se počeli pojavljivati prvi računari.

Početak OCR-a smatraju se 50-te godine 20.vijeka kako je napredovala elektronska obrada podataka. Podaci su se unosili kroz bušene kartice i bilo je potrebno naći efikasnije rješenje za unos podataka. U isto to vrijeme tehnologija za razvoj mašina za čitanje je postala dovoljno razvijena za upotrebu i do sredine 1950-te OCR mašine su postale komercijalno dostupne. Prva OCR mašina za čitanje je postavljena 1954. godine, a koristila se za konverziju izvještaja o prodaji, koji su bili pisani štampanim slovima, u bušene kartice kao ulaz u računar.

PRVA GENERACIJA OCR-a

OCR mašine koje su proizvedene u period od 1960-1965 godine nazivaju se prvom generacijom ove nove tehnologije. Ova generacija mašina je prepoznavala karaktere određenog fonta i veličine. Simboli su bili specijalno kreirani za OCR mašine i prve verzije nisu izgledale prirodno. Nakon nekog vremene počele su se pojavljivati mašine za čitanje više različitih fontova, mogle su čitati i do 10 različitih fontova. Broj fontova bio je ograničen metodama prepoznavanja koja se koristila.

Metoda prepoznavanja šablona je da se svaki karakter poredio sa bazom koja je imala prototip slika za svaki karakter svakog fonta. Kasnije se razvila i metoda prepoznavanja svojstva koja je trebala da omogući prepoznavanje karaktera nezavisno od fonta koji se koristio.

DRUGA GENERACIJA OCR-a

Druga generacija proizvedene su od sredine 1960 do 1970, a ovi sistemi bili su u mogućnosti da prepoznaju karaktere pisaćih mašina i postojala je opcija za prepoznavanje ručno štampanih karaktera. Rukom štampani karakteri su bili ograničeni na brojeve, par slova i simbola. Prvi i najpoznatiji sistem ove vrste je bio IBM 1287, koji je bio predstavljen u Americi 1965.godine. Takođe u tom period svoje mašine su razvijale i kompanije Hitaki i Tošiba.  U ovom periodu se dosta uradilo na polju standardizacije. Godine 1966 detaljne studije OCR zahtjeva su se završile i definisan je Američki skup OCR karaktera (OCR-A). Stil i dizajn karaktera je bio pogodan za OCR mašine, ali i čitljiv za ljude. Evropski font je takođe definisan (OCR-B) koji je bio prirodniji font od američkog. Bilo je i pokušaja da se od ta dva fonta dobije jedan, ali su umjesto toga na kraju mašine mogle da prepoznaju i jedan i drugi standard.

TREĆA GENERACIJA OCR-a

Treća generacija OCR-a mašina je proizveden sredinom 1970 do 1985, a radilo se na prepoznavanju dokumenata slabog kvaliteta, kao i skupova karaktera koji su bili ručno pisani i različitih veličina. Takođe je bila ideja da mašine budu jefitinije i većih performansi, što je omogućio tadašnji brz razvoj hardverske tehnologije.

Na tržištu su se počele pojavljivati i sofisticiranije OCR mašine, jednostavni OCR uređaji su i dalje bili najkorisniji. Tokom perioda prije nego što su počeli da vladaju personalni računari i laserski štampači, kucanje je posebno odgovaralo OCR-u. Uniformisano razdvajanje slova kao i mali broj fontova su jednostavno dizajnirani OCR uređaje činili korisnijim. Obična pisaća mašina je mogla da  napiše prvu verziju teksta a zatim preko OCR uređaja da se spremi u računar, gdje se moglo raditi i dalje na izmjeni i finalnoj doradi. Tadašnji programi za obradu teksta bili su skupi, a naučnici su radili na razvoju kako bi smanjili  troškove. Što će se u budućnosti i ostvariti, te danas OCR predstavlja tehnologiju uštede.

OCR DANAS

Iako su OCR mašine postale komercijalno dostupne već 1950-ih, samo nekoliko hiljada uređaja je prodato u svijetu do 1986.godine. Glavni razlog za to bila je cijena sistema. Ubrzo se situacija počela mijenjati kada je i cijena hardvera opadala, a OCR sistemi su se počeli pojavljivati kao paket softvera, samim tim je i prodaja porasla.

Kompanija MMSCODE ima svoj proizvod, OCR softver, čiji je slogan skenirana dimenzija poslovanja.

Svi smo u potrazi za metodama i tehnologijama koje omogućavaju efikasniji rad i smanjenje troškova, a to je glavna osobina naših proizvoda.

Naša aplikacija OCR ne čita samo podatke već i pronalazi smisao u njima kako bi vam dala tačnu i pravovremenu informaciju. Aplikacija dolaziu paketu koji sadrži najsavremenije biblioteke karaktera i objekata, te vam obezbjeđuje siguran prenos podataka i maksimalnu zaštitu informacija. Softver pruža ogromnu pouzdanost pri skeniranju, brzo očitavanje i smanjenje troškova, ubrzavanje procesa i prikupljanje podataka koji se ugrađuju u različite sisteme i aplikacije. Upotrebom našeg softvera ne morate brinuti kakva je WiFi mreža jer on radi nezavisno od nje, a ono što je važno njegovom primjenom povećavate lojalnost i zadovoljstvo kod svojih potrošača i kupaca.

Sistem OCR-a MMSCODE kompanije vam omogućava poboljšavanje poslovnog procesa, ubrzava proces rada, bolje performanse, siguran proces rada, brzo očitavanje, brže procese, veliku pouzdanost pri skeniranju, prikupljanje podataka o ponašanju korisnika.

VAŠ MMSCODE

MI STVARAMO SISTEME BUDUĆNOSTI