Agħraf it-test online f'fajl PDF

Pin
Send
Share
Send


Huwa 'l bogħod minn dejjem possibbli li jiġi estratt test minn fajl PDF bl-użu ta' kkupjar regolari. Ħafna drabi l-paġni ta 'dawn id-dokumenti huma kontenut skannjat tal-verżjonijiet tal-karta tagħhom. Biex dawn il-fajls jinbidlu f’dejta ta ’test li tista’ tittiekel kompletament, jintużaw programmi speċjali bil-funzjoni tar-Rikonoxximent tal-Karattri Ottiċi (OCR).

Deċiżjonijiet bħal dawn huma diffiċli ħafna biex jiġu implimentati u, għalhekk, jiswew ħafna flus. Jekk trid tirrikonoxxi test minn PDF regolarment, huwa pjuttost rakkomandabbli li tixtri l-programm xieraq. Għal każijiet rari, ikun iktar loġiku li wieħed juża wieħed mis-servizzi disponibbli online b'funzjonijiet simili.

Kif tirrikonoxxi test minn PDF online

Naturalment, il-firxa tal-karatteristiċi tas-servizzi onlajn OCR, meta mqabbla ma 'soluzzjonijiet tad-desktop full-sħiħ, hija aktar limitata. Iżda tista 'wkoll taħdem ma' dawn ir-riżorsi jew b'xejn jew bi ħlas nominali. Il-ħaġa ewlenija hija li bil-kompitu ewlieni tagħhom, jiġifieri bir-rikonoxximent tat-test, l-applikazzjonijiet tal-web korrispondenti jlaħħqu wkoll.

Metodu 1: ABBYY FineReader Online

Il-kumpanija għall-iżvilupp tas-servizzi hija waħda mill-mexxejja fil-qasam tar-rikonoxximent tad-dokumenti ottiċi. ABBYY FineReader għall-Windows u Mac hija soluzzjoni qawwija biex tikkonverti PDF għal test u taħdem aktar miegħu.

L-analogu tal-programm ibbażat fuq il-web, ovvjament, huwa inferjuri għalih fil-funzjonalità. Madankollu, is-servizz jista 'jirrikonoxxi test minn skans u ritratti f'aktar minn 190 lingwa. Ikkonverti fajls PDF għal Word, Excel, dokumenti eċċ.

ABBYY FineReader Online Servizz Online

  1. Qabel ma tibda taħdem ma 'l-għodda, ħoloq kont fuq is-sit jew idħol bl-użu tal-kont Facebook tiegħek, Google jew Microsoft.

    Biex tmur fit-tieqa tal-awtorizzazzjoni, ikklikkja fuq il-buttuna "Dħul" fil-bar tal-menu ta 'fuq.
  2. Wara li dħalt, timporta d-dokument PDF mixtieq f'FinReader billi tuża l-buttuna "Itella 'l-fajls".

    Imbagħad ikklikkja "Agħżel numri tal-paġna" u speċifika l-intervall mixtieq għar-rikonoxximent tat-test.
  3. Sussegwentement, agħżel il-lingwi preżenti fid-dokument, il-format tal-fajl li jirriżulta, u kklikkja fuq il-buttuna "Agħraf".
  4. Wara l-ipproċessar, li t-tul tiegħu jiddependi kompletament mill-volum tad-dokument, tista 'tniżżel il-fajl lest bid-dejta tat-test sempliċement billi tikklikkja fuq isimha.

    Jew, esportaha lejn wieħed mis-servizzi tas-sħab disponibbli.

Probabbilment is-servizz huwa distint mill-iktar algoritmi preċiżi ta 'rikonoxximent tat-test fuq immaġini u fajls PDF. Imma, sfortunatament, l-użu liberu tagħha huwa limitat għal ħames paġni proċessati kull xahar. Biex taħdem b'dokumenti aktar voluminużi, ser ikollok tixtri abbonament annwali.

Madankollu, jekk l-OCR huwa rarament meħtieġ, ABBYY FineReader Online hija għażla kbira biex jiġi estratt test minn fajls PDF żgħar.

Metodu 2: OCR Online B'xejn

Servizz sempliċi u konvenjenti għad-diġitizzazzjoni tat-test. Mingħajr reġistrazzjoni, ir-riżors jippermettilek tirrikonoxxi 15-il paġna PDF sħiħa fis-siegħa. L-OCR Online B'xejn jaħdem bis-sħiħ b'dokumenti f'46 lingwa u mingħajr awtorizzazzjoni jappoġġja tliet formati ta 'esportazzjoni ta' test - DOCX, XLSX u TXT.

Meta tirreġistra, l-utent ikollu l-opportunità li jipproċessa dokumenti b'ħafna paġna, iżda n-numru bla ħlas ta 'dawn l-istess paġni huwa limitat għal 50 unità.

Servizz OCR Online B'Xejn

  1. Biex tirrikonoxxi t-test minn PDF bħala "mistieden", mingħajr awtorizzazzjoni fuq ir-riżorsa, uża l-formola xierqa fuq il-paġna ewlenija tas-sit.

    Agħżel id-dokument mixtieq bl-użu tal-buttuna Fajl, speċifika l-lingwa ewlenija tat-test, il-format tal-produzzjoni, imbagħad stenna li l-fajl jitgħabba u kklikkja Ikkonverti.
  2. Fi tmiem il-proċess tad-diġitizzazzjoni, ikklikkja "Niżżel il-fajl tal-ħruġ" biex issalva d-dokument lest bit-test fuq il-kompjuter.

Għal utenti awtorizzati, is-sekwenza tal-azzjonijiet hija kemmxejn differenti.

  1. Uża l-buttuna "Reġistrazzjoni" jew "Dħul" fil-bar tal-menu ta 'fuq biex, skond dan, tinħoloq kont OCR Online B'Xejn jew idħol għalih.
  2. Wara l-awtorizzazzjoni fil-pannell ta 'għarfien, żomm iċ-ċavetta CTRL, agħżel sa żewġ lingwi tad-dokument sors mil-lista pprovduta.
  3. Speċifika aktar għażliet għall-estrazzjoni ta 'test minn PDF u kklikkja Agħżel fajl biex ittella 'dokument lis-servizz.

    Imbagħad, biex tibda r-rikonoxximent, ikklikkja Ikkonverti.
  4. Fi tmiem l-ipproċessar tad-dokument, ikklikkja fuq il-link bl-isem tal-fajl tal-produzzjoni fil-kolonna korrispondenti.

    Ir-riżultat tar-rikonoxximent jiġi ffrankat immedjatament fil-memorja tal-kompjuter tiegħek.

Jekk inti teħtieġ estratt test minn dokument PDF żgħir, tista 'tirrikorri għall-użu tal-għodda t'hawn fuq. Biex taħdem ma 'fajls voluminużi, ser ikollok tixtri karattri addizzjonali f'OCR Free Online jew tuża soluzzjoni oħra.

Metodu 3: NewOCR

Servizz OCR kompletament b'xejn li jippermettilek li jiġi estratt test minn kważi kwalunkwe dokument grafiku u elettroniku bħal DjVu u PDF. Ir-riżorsa ma timponix restrizzjonijiet fuq id-daqs u n-numru ta 'fajls rikonoxxuti, ma teħtieġx reġistrazzjoni u toffri firxa wiesgħa ta' funzjonijiet relatati.

NewOCR jappoġġja 106 lingwa u jista 'jipproċessa b'mod korrett anke skans ta' dokumenti ta 'kwalità baxxa. Huwa possibbli li tagħżel manwalment iż-żona għar-rikonoxximent tat-test fuq il-paġna tal-fajl.

Servizz onlajn NewOCR

  1. Allura, tista 'tibda taħdem ma' riżorsa immedjatament, mingħajr il-bżonn li twettaq azzjonijiet bla bżonn.

    Dritt fuq il-paġna ewlenija hemm formola għall-importazzjoni ta 'dokument fuq is-sit. Biex ittella 'fajl fuq NewOCR, uża l-buttuna "Agħżel fajl" fit-taqsima "Agħżel il-fajl tiegħek". Imbagħad fl-għalqa "Il-lingwa (i) ta 'rikonoxximent" speċifika lingwa waħda jew aktar tad-dokument sors, imbagħad ikklikkja "Itella + OCR".
  2. Issettja l-issettjar ta 'rikonoxximent preferut tiegħek, agħżel il-paġna minn fejn trid estratt test minn u kklikkja fuq il-buttuna OCR.
  3. Skrollja 'l isfel il-paġna ftit u sib il-buttuna "Niżżel".

    Ikklikkja fuqha u fil-lista drop-down agħżel il-format tad-dokument meħtieġ biex titniżżel. Wara dan, il-fajl lest bit-test estratt jitniżżel mill-kompjuter tiegħek.

L-għodda hija konvenjenti u kwalità pjuttost għolja tirrikonoxxi l-karattri kollha. Madankollu, l-ipproċessar ta 'kull paġna tad-dokument PDF impurtat għandu jinbeda b'mod indipendenti u jintwera f'fajl separat. Tista ', ovvjament, tikkopja immedjatament ir-riżultati tar-rikonoxximent fuq il-clipboard u tgħaqqadhom ma' oħrajn.

Madankollu, minħabba n-nuqqas deskritt hawn fuq, huwa diffiċli ħafna li jiġu estratti ammonti kbar ta 'test billi tuża NewOCR. Bil-fajls żgħar, is-servizz jaffronta bil-bang.

Metodu 4: OCR.Space

Riżors sempliċi u li jinftiehem għad-diġitizzazzjoni tat-test, jippermettilek tirrikonoxxi dokumenti PDF u toħroġ ir-riżultat għal fajl TXT. L-ebda limitu fuq in-numru ta ’paġni ma huwa provdut. L-unika limitazzjoni hija li d-daqs tad-dokument tal-input m'għandux jaqbeż il-5 megabytes.

Servizz OCR.Space Online

  1. Ir-reġistru biex jaħdem bl-għodda mhux meħtieġ.

    Segwi biss il-link ta 'hawn fuq u ittella' d-dokument PDF fuq il-websajt mill-kompjuter billi tuża l-buttuna "Agħżel fajl" jew min-netwerk - b'referenza.
  2. Fil-lista li tinżel "Agħżel il-lingwa OCR" Agħżel il-lingwa tad-dokument importat.

    Imbagħad ibda l-proċess tar-rikonoxximent tat-test billi tikklikkja fuq il-buttuna "Ibda OCR!".
  3. Fi tmiem l-ipproċessar tal-fajl, aqra r-riżultat fil-qasam Riżultat OCR'ed u kklikkja "Niżżel"tniżżel id-dokument TXT lest.

Jekk inti sempliċiment teħtieġ li estratt it-test mill-PDF u fl-istess ħin l-ifformattjar finali tiegħu mhuwiex daqstant importanti, OCR.Space hija għażla tajba. L-unika ħaġa hi li d-dokument għandu jkun "monolingwi", billi r-rikonoxximent ta 'żewġ lingwi jew aktar fl-istess ħin mhuwiex previst fis-servizz.

Ara wkoll: Analogi b'xejn ta 'FineReader

L-istima ta 'l-għodod online ippreżentati fl-artiklu, għandu jkun innutat li FineReader Online minn ABBYY tieħu ħsieb il-funzjoni OCR bl-aktar mod preċiż u effiċjenti. Jekk l-eżattezza massima tar-rikonoxximent tat-test hija importanti għalik, huwa aħjar li tikkunsidra din l-għażla speċifikament. Iżda x'aktarx, inti wkoll ikollok tħallas għaliha.

Jekk trid tiddiżjonalizza dokumenti żgħar u int lest biex tikkoreġi b'mod indipendenti l-iżbalji fis-servizz, huwa rrakkomandat li tuża NewOCR, OCR.Space jew OCR Free Online.

Pin
Send
Share
Send