OCR (Optical Character Recognition) sau recunoasterea optica a caracterelor reprezinta conversia in format electronic a imaginii unui text tiparit sau scris de mana. Este utilizat pe scara larga ca modalitate de extragere a datelor din documentele tiparite (facturi, extrase bancare, chitante, pasapoarte etc), fotografiate sau scanate.
Pentru a extrage şi modifica datele din documente scanate, imagini provenite de la camera digitală sau fişiere PDF de tip „numai imagine”, este nevoie de un program OCR care să identifice literele din imagine, să le combine în cuvinte, iar apoi cuvintele în propoziţii. Astfel se poate accesa şi edita conţinutul documentului original.

Socializam si pe: