Publicitate
Dacă doriți să convertiți orice text tipărit în text digital pe care îl puteți copia, lipi, edita și căuta, va trebui să folosiți scanere optice de recunoaștere a caracterelor (OCR).
Când alegeți să scanați sau să faceți o fotografie a unui document, aceasta va fi salvată într-un format precum JPEG sau PDF. Software OCR poate apoi să recunoască literele și numerele din aceste documente și să le convertească în PDF căutabil 4 Metode de creare și editare a fișierelor PDF gratuitDintre toate tipurile de fișiere comune întâlnite în lumea noastră de calcul, PDF este probabil unul dintre cele mai restrictive, fiind în același timp disponibil pentru toată lumea să folosească (în primul rând pentru a citi) ... Citeste mai mult sau într-un fișier pe care îl puteți edita în programe precum Microsoft Word.
Problema este că unele scanere OCR funcționează mult mai bine decât altele, cele mai bune fiind destul de grele pe portofel.
Omnipage18, de exemplu, costă 150 USD, dar este deosebit de bun în recunoașterea diferitelor limbi.
Adobe Acrobat Pro DC costă o udare cu ochi de 400 de dolari, dar are o precizie incredibilă. ABBYY FineReader costă 150 de dolari, dar este fantastic pentru a converti documente precum reviste și broșuri în text căutabil. Vom testa ulterior oferta online a ABBYY în acest articol.Cu toate acestea, dacă aveți după alternative gratuite pe care le puteți Descarca și utilizați pe Windows sau OS X, ar trebui încercați aceste instrumente OCR Cele mai bune 5 instrumente OCR pentru extragerea textului din imaginiCând aveți reams de hârtie, cum puteți transforma tot textul tipărit în ceva pe care un program digital va putea să-l recunoască și să-l indice? Păstrați un software OCR bun de aproape. Citeste mai mult . Dar dacă utilizați mai degrabă un gratuit, pe net Instrumentul OCR, continuă să citești, așa cum am încercat primele câteva, cu rezultatele de mai jos.
Testul
Se pare că majoritatea oamenilor le folosesc acum smartphone-urile să-și facă scanarea pentru ele Scanați și gestionați încasările, economisiți spațiu, hârtie și timpÎncasările pe hârtie sunt ușor pierdute și greu de găsit atunci când ai nevoie cel mai mult. Din fericire, a merge digital rezolvă ambele aceste probleme. Citeste mai mult , Am decis să folosesc Aplicația scanabilă a Evernote (Gratuit pe iOS și Android). Am scanat prima pagină a lui Richard Dawkin Urcarea Muntelui Îmbunătățită, pentru a vedea ce rezultate am putea obține cu o formatare foarte de bază. Am scanat și o pagină a lui Tim Ferriss ” Chef de 4 ore pentru a încerca scanerele cu o formatare ceva mai complicată. Am salvat fiecare dintre aceste fișiere ca PDF.
Aceste documente au fost apoi trecute prin unele dintre cele presupuse cele mai bune instrumente OCR online pentru a vedea cât de bine s-au arătat.
OCR online gratuit [Nu mai este disponibil]
Din fericire, nu este necesară înregistrarea pentru a utiliza OCR gratuit online. Și am fost de două ori impresionat când am văzut pretenția lor de a păstra formatarea și aspectul documentului meu.
Site-ul susține că poate suporta PDF, GIF, BMP, JPEG, TIFF și PNG ca intrare. Rezultatele pot fi fie DOC, un document text PDF, RTF și TXT. Din păcate, nu am putut afla dacă au o limită de dimensiune a fișierului.
Document de bază în PDF
Convertit absolut perfect. Nu prea sunt multe de spus! Suntem plecați la foarte un bun inceput.
Document de bază la DOC
Cuvintele reale par să se fi transformat perfect, în afară de „ount” de la „Mount Rushmore”, cumva a merge AWOL. Cu toate acestea, formatarea este o poveste diferită. Multe virgule au fost înlocuite cu scoruri mici și spații aleatorii au fost introduse în punctele din întregul document. Când vedeți mai târziu cum a rezultat software-ul premium la acest test, nu este un efort prost deloc.
Document complex în PDF
Conversia documentului a durat 120 de secunde! Odată finalizat, tot textul a fost convertit cu o precizie de aproximativ 95%, deși textul din caseta separată din partea dreaptă sus a paginii era de nevăzut. Alte câteva personaje din PDF au fost incorecte.
Document complex la DOC
De această dată, conversia a durat doar 10 secunde, textul fiind din nou convertit cu o precizie de aproximativ 95%. Au existat unele probleme de spațiere ciudate, iar software-ul a avut probleme la convertirea fontului din partea dreaptă sus a documentului și a ratat câteva caractere aici și acolo.
Verdict
Dacă doriți să convertiți documente formatate simplu în PDF, acesta este un instrument fantastic. În ceea ce privește conversia în DOC, rezultatele nu au fost nimic despre care scriem acasă.
i2OCR face câteva afirmații impresionante. Instrumentul recunoaște peste 60 de limbi, poate gestiona machete cu mai multe coloane (prin eliminarea formatării), nu are limite de dimensiune a fișierului, poate converti fișiere încărcate și de la adresele URL. Și nu trebuie să vă înregistrați pentru a utiliza acest instrument.
Serviciul funcționează printr-o simplă extragere a textului din imaginea dvs., apoi prin emiterea de text neformatat. Puteți corecta rapid orice greșeală în vizualizarea din lateral, înainte de a copia textul în alte programe sau de a descărca în format DOC, PDF sau HTML.
Notă: când am încercat să încărc documentele mele PDF, acestea au fost respinse de i2OCR, așa că a trebuit să le convertesc în JPEG (luând o captură de ecran a acestora, apoi încărcând fișierele).
Document de bază pentru text simplu
Datorită modului în care funcționează acest instrument, toată formatarea este pierdută, deși conversia de la imagine la text a fost aproape perfectă. Au existat unele mici erori, cum ar fi distanțarea paragrafelor, iar unele virgule au fost înlocuite cu perioade, dar acestea sunt niște mici.
Document complex pentru text simplu
Majoritatea textului a fost convertită fără prea multe greșeli, în afară de titlul și rețeta din partea dreaptă sus, ceea ce era imposibil de citit pentru acest instrument. Modul în care coloanele au fost convertite în text simplu era departe de a fi ideal. Dacă doriți să faceți această conversie viabilă, ar fi nevoie de mult timp pentru a rearanja liniile în propoziții coerente.
Verdict
Pentru documentele de bază, i2OCR funcționează excelent. Posibilitatea de a edita textul înainte de descărcare este, de asemenea, o atingere foarte frumoasă. Cu toate acestea, pentru documente mai complexe, conversia este încă destul de precisă, dar modul în care este transmis textul nu vă va facilita viața.
OCR online acceptă în prezent 46 de limbi diferite și poate converti PDF, JPG, BMP, TIFF și GIF în format Word, Excel sau Text simplu. Site-ul susține că „documentele convertite arată exact ca originalul - tabele, coloane și grafică”.
Versiunea pe care o puteți utiliza fără înregistrare vă permite să convertiți până la 15 imagini pe oră (limita de 5mb). Dacă vă înscrieți pentru un cont, puteți achiziționa mai multe pagini peste această limită, de asemenea, puteți converti documente cu mai multe pagini și arhive ZIP.
Document de bază la DOC
Documentul de bază a devenit impecabil în afară de cifra romană eu nefiind ridicat. După cum a promis site-ul, formatarea a fost exact așa cum a fost în carte. Kudos la acest instrument.
Document complex la DOC
După ce am fost dezamăgit de instrumentele anterioare OCR în conversia documentului complex, am fost impresionat masiv de OCR online. Aspectul a fost aproape perfect, așa cum puteți vedea mai sus. Încă o dată, rețeta nu a fost prea bine ridicată, dar orice alte greșeli minore au fost neglijabile.
Verdict
Rezultate absolut fantastice din OCR online. Singurul dezavantaj pe care îl văd este că nu există nicio modalitate de a descărca documentele convertite ca PDF-uri, deoarece formatele de ieșire menționate includ doar DOCX, XLSX și TXT.
Așa cum am menționat anterior, ABBYY este unul dintre liderii pieței în software-ul OCR, costând în jur de 150 de dolari pentru programul lor complet, descărcabil. Ei oferă un Proces gratuit de 10 pagini pentru instrumentul lor online, însă (este necesară înregistrarea). Pentru un abonament de 5 dolari, instrumentul lor online vă va permite să convertiți 200 de pagini în fiecare lună.
Fișierele acceptate pot fi de până la 100mb, în oricare dintre aceste formate: PDF, JPG, JPEG, TIF, TIFF, PCX, DCX, BMP și PNG. ABBYY recunoaște, de asemenea, aproape 200 de limbi. Ieșirile sunt deosebit de impresionante, alegând DOCX, XLSX, RTF, TXT, PPTX, ODT, PDF, FB2 și EPUB.
Puteți încerca chiar și câteva funcții BETA în timpul procesului. Prima este opțiunea de a traduce documentul într-o altă limbă. Celălalt este să exportați documentul convertit în contul dvs. de stocare în cloud, fie că este vorba despre Dropbox, Google Drive, Evernote, Microsoft OneDrive sau Box.
Document de bază pentru DOCX
Rezultatele generale au fost bune, dar nu este uimitor, având în vedere că acesta este un produs premium. Au fost schimbate mai multe virgule și perioade, mai multe virgule inversate au fost înlocuite cu un asterix, lipseau câteva litere majuscule și un cuvânt (literalist) a fost scris corect.
Document complex pentru DOCX
Odată convertiți, au existat foarte puține erori în textul documentului (în afară de OCR care se luptă din nou cu fontul rețetei!), Dar formatarea a lăsat multe de dorit.
Cele trei coloane au ocupat cumva două pagini, cu coloana centrală numai apărând pe a doua pagină. Dacă ai vrut de fapt do orice lucru cu acest document convertit, veți ajunge să vă smulgeți părul.
Document de bază în PDF
În timp ce examinez PDF-ul convertit, nu am găsit nicio eroare. Poate am găsit unde excelează ABBYY. Rezultate fantastice.
Document complex în PDF
Din nou, nu am găsit nicio eroare în acest fișier convertit. În mod evident, ABBYY știe să convertească la PDF în mod excepțional.
Verdict
Dacă sunteți mulțumit să plătiți câțiva dolari, conversia în PDF pare să funcționeze foarte bine cu acest serviciu și să fie capabil să sincronizați fișierele convertite în spațiul dvs. de stocare în cloud este util în special dacă scanați un volum mare de documente. Cu toate celelalte opțiuni, ABBYY încă nu și-a dat seama cum să transforme impecabil documentele în DOC pentru o editare ușoară.
Rezultatul final
Dacă, ca majoritatea oamenilor, căutați doar să scanați câteva articole din revistă și unele facturi ale gospodăriei, nu va trebui să editați aceste documente. Prin urmare, conversia directă într-un PDF va fi potrivită pentru dvs., deoarece veți mai putea căuta aceste documente. Pentru aceasta, OCR gratuit online a fost cu siguranță cel mai bun instrument gratuit pe care l-am testat. Acestea fiind spuse, dacă sunteți dispus să plătiți 5 USD pe lună pentru o perfecționare aproape, FineReader ABBYY online a fost ceva mai exact.
Când vine vorba de conversia documentelor în DOC, nu am reușit să găsim nicio soluție perfectă, dar de departe au fost cele mai bune rezultate. OCR online. Conversia nu a fost perfectă, dar integritatea formatării a fost păstrată în mare parte intactă, iar greșelile au fost neglijabile. Atunci când comparăm aceste rezultate cu oferta „premium” de la ABBYY, nu vă puteți ajuta, dar vă veți impresiona masiv.
Nu am inclus Capabilitățile OCR ale Google Drive în acest post; un pic pentru conștientizarea Google, dar mai mult pentru faptul că am dorit să testăm alte câteva servicii OCR online gratuite.
Peste dvs.: Ce alte instrumente OCR online ați recomanda cititorilor noștri? Și care ai încercat să nu mai folosești niciodată?
Rob Nightingale este licențiat în filozofie la Universitatea din York, Marea Britanie. A lucrat ca manager de social media și consultant timp de peste cinci ani, oferind ateliere în mai multe țări. În ultimii doi ani, Rob a fost și scriitor tehnologic și este Social Media Manager și Makeletter Editor. De obicei îl vei găsi călătorind...