Huwa 'l bogħod minn dejjem possibbli li jiġi estratt test minn fajl PDF bl-użu ta' kkupjar regolari. Ħafna drabi l-paġni ta 'dawn id-dokumenti huma kontenut skannjat tal-verżjonijiet tal-karta tagħhom. Biex dawn il-fajls jinbidlu f’dejta ta ’test li tista’ tittiekel kompletament, jintużaw programmi speċjali bil-funzjoni tar-Rikonoxximent tal-Karattri Ottiċi (OCR).
Deċiżjonijiet bħal dawn huma diffiċli ħafna biex jiġu implimentati u, għalhekk, jiswew ħafna flus. Jekk trid tirrikonoxxi test minn PDF regolarment, huwa pjuttost rakkomandabbli li tixtri l-programm xieraq. Għal każijiet rari, ikun iktar loġiku li wieħed juża wieħed mis-servizzi disponibbli online b'funzjonijiet simili.
Kif tirrikonoxxi test minn PDF online
Naturalment, il-firxa tal-karatteristiċi tas-servizzi onlajn OCR, meta mqabbla ma 'soluzzjonijiet tad-desktop full-sħiħ, hija aktar limitata. Iżda tista 'wkoll taħdem ma' dawn ir-riżorsi jew b'xejn jew bi ħlas nominali. Il-ħaġa ewlenija hija li bil-kompitu ewlieni tagħhom, jiġifieri bir-rikonoxximent tat-test, l-applikazzjonijiet tal-web korrispondenti jlaħħqu wkoll.
Metodu 1: ABBYY FineReader Online
Il-kumpanija għall-iżvilupp tas-servizzi hija waħda mill-mexxejja fil-qasam tar-rikonoxximent tad-dokumenti ottiċi. ABBYY FineReader għall-Windows u Mac hija soluzzjoni qawwija biex tikkonverti PDF għal test u taħdem aktar miegħu.
L-analogu tal-programm ibbażat fuq il-web, ovvjament, huwa inferjuri għalih fil-funzjonalità. Madankollu, is-servizz jista 'jirrikonoxxi test minn skans u ritratti f'aktar minn 190 lingwa. Ikkonverti fajls PDF għal Word, Excel, dokumenti eċċ.
ABBYY FineReader Online Servizz Online
- Qabel ma tibda taħdem ma 'l-għodda, ħoloq kont fuq is-sit jew idħol bl-użu tal-kont Facebook tiegħek, Google jew Microsoft.
Biex tmur fit-tieqa tal-awtorizzazzjoni, ikklikkja fuq il-buttuna "Dħul" fil-bar tal-menu ta 'fuq. - Wara li dħalt, timporta d-dokument PDF mixtieq f'FinReader billi tuża l-buttuna "Itella 'l-fajls".
Imbagħad ikklikkja "Agħżel numri tal-paġna" u speċifika l-intervall mixtieq għar-rikonoxximent tat-test. - Sussegwentement, agħżel il-lingwi preżenti fid-dokument, il-format tal-fajl li jirriżulta, u kklikkja fuq il-buttuna "Agħraf".
- Wara l-ipproċessar, li t-tul tiegħu jiddependi kompletament mill-volum tad-dokument, tista 'tniżżel il-fajl lest bid-dejta tat-test sempliċement billi tikklikkja fuq isimha.
Jew, esportaha lejn wieħed mis-servizzi tas-sħab disponibbli.
Probabbilment is-servizz huwa distint mill-iktar algoritmi preċiżi ta 'rikonoxximent tat-test fuq immaġini u fajls PDF. Imma, sfortunatament, l-użu liberu tagħha huwa limitat għal ħames paġni proċessati kull xahar. Biex taħdem b'dokumenti aktar voluminużi, ser ikollok tixtri abbonament annwali.
Madankollu, jekk l-OCR huwa rarament meħtieġ, ABBYY FineReader Online hija għażla kbira biex jiġi estratt test minn fajls PDF żgħar.
Metodu 2: OCR Online B'xejn
Servizz sempliċi u konvenjenti għad-diġitizzazzjoni tat-test. Mingħajr reġistrazzjoni, ir-riżors jippermettilek tirrikonoxxi 15-il paġna PDF sħiħa fis-siegħa. L-OCR Online B'xejn jaħdem bis-sħiħ b'dokumenti f'46 lingwa u mingħajr awtorizzazzjoni jappoġġja tliet formati ta 'esportazzjoni ta' test - DOCX, XLSX u TXT.
Meta tirreġistra, l-utent ikollu l-opportunità li jipproċessa dokumenti b'ħafna paġna, iżda n-numru bla ħlas ta 'dawn l-istess paġni huwa limitat għal 50 unità.
Servizz OCR Online B'Xejn
- Biex tirrikonoxxi t-test minn PDF bħala "mistieden", mingħajr awtorizzazzjoni fuq ir-riżorsa, uża l-formola xierqa fuq il-paġna ewlenija tas-sit.
Agħżel id-dokument mixtieq bl-użu tal-buttuna Fajl, speċifika l-lingwa ewlenija tat-test, il-format tal-produzzjoni, imbagħad stenna li l-fajl jitgħabba u kklikkja Ikkonverti. - Fi tmiem il-proċess tad-diġitizzazzjoni, ikklikkja "Niżżel il-fajl tal-ħruġ" biex issalva d-dokument lest bit-test fuq il-kompjuter.
Għal utenti awtorizzati, is-sekwenza tal-azzjonijiet hija kemmxejn differenti.
- Uża l-buttuna "Reġistrazzjoni" jew "Dħul" fil-bar tal-menu ta 'fuq biex, skond dan, tinħoloq kont OCR Online B'Xejn jew idħol għalih.
- Wara l-awtorizzazzjoni fil-pannell ta 'għarfien, żomm iċ-ċavetta CTRL, agħżel sa żewġ lingwi tad-dokument sors mil-lista pprovduta.
- Speċifika aktar għażliet għall-estrazzjoni ta 'test minn PDF u kklikkja Agħżel fajl biex ittella 'dokument lis-servizz.
Imbagħad, biex tibda r-rikonoxximent, ikklikkja Ikkonverti. - Fi tmiem l-ipproċessar tad-dokument, ikklikkja fuq il-link bl-isem tal-fajl tal-produzzjoni fil-kolonna korrispondenti.
Ir-riżultat tar-rikonoxximent jiġi ffrankat immedjatament fil-memorja tal-kompjuter tiegħek.
Jekk inti teħtieġ estratt test minn dokument PDF żgħir, tista 'tirrikorri għall-użu tal-għodda t'hawn fuq. Biex taħdem ma 'fajls voluminużi, ser ikollok tixtri karattri addizzjonali f'OCR Free Online jew tuża soluzzjoni oħra.
Metodu 3: NewOCR
Servizz OCR kompletament b'xejn li jippermettilek li jiġi estratt test minn kważi kwalunkwe dokument grafiku u elettroniku bħal DjVu u PDF. Ir-riżorsa ma timponix restrizzjonijiet fuq id-daqs u n-numru ta 'fajls rikonoxxuti, ma teħtieġx reġistrazzjoni u toffri firxa wiesgħa ta' funzjonijiet relatati.
NewOCR jappoġġja 106 lingwa u jista 'jipproċessa b'mod korrett anke skans ta' dokumenti ta 'kwalità baxxa. Huwa possibbli li tagħżel manwalment iż-żona għar-rikonoxximent tat-test fuq il-paġna tal-fajl.
Servizz onlajn NewOCR
- Allura, tista 'tibda taħdem ma' riżorsa immedjatament, mingħajr il-bżonn li twettaq azzjonijiet bla bżonn.
Dritt fuq il-paġna ewlenija hemm formola għall-importazzjoni ta 'dokument fuq is-sit. Biex ittella 'fajl fuq NewOCR, uża l-buttuna "Agħżel fajl" fit-taqsima "Agħżel il-fajl tiegħek". Imbagħad fl-għalqa "Il-lingwa (i) ta 'rikonoxximent" speċifika lingwa waħda jew aktar tad-dokument sors, imbagħad ikklikkja "Itella + OCR". - Issettja l-issettjar ta 'rikonoxximent preferut tiegħek, agħżel il-paġna minn fejn trid estratt test minn u kklikkja fuq il-buttuna OCR.
- Skrollja 'l isfel il-paġna ftit u sib il-buttuna "Niżżel".
Ikklikkja fuqha u fil-lista drop-down agħżel il-format tad-dokument meħtieġ biex titniżżel. Wara dan, il-fajl lest bit-test estratt jitniżżel mill-kompjuter tiegħek.
L-għodda hija konvenjenti u kwalità pjuttost għolja tirrikonoxxi l-karattri kollha. Madankollu, l-ipproċessar ta 'kull paġna tad-dokument PDF impurtat għandu jinbeda b'mod indipendenti u jintwera f'fajl separat. Tista ', ovvjament, tikkopja immedjatament ir-riżultati tar-rikonoxximent fuq il-clipboard u tgħaqqadhom ma' oħrajn.
Madankollu, minħabba n-nuqqas deskritt hawn fuq, huwa diffiċli ħafna li jiġu estratti ammonti kbar ta 'test billi tuża NewOCR. Bil-fajls żgħar, is-servizz jaffronta bil-bang.
Metodu 4: OCR.Space
Riżors sempliċi u li jinftiehem għad-diġitizzazzjoni tat-test, jippermettilek tirrikonoxxi dokumenti PDF u toħroġ ir-riżultat għal fajl TXT. L-ebda limitu fuq in-numru ta ’paġni ma huwa provdut. L-unika limitazzjoni hija li d-daqs tad-dokument tal-input m'għandux jaqbeż il-5 megabytes.
Servizz OCR.Space Online
- Ir-reġistru biex jaħdem bl-għodda mhux meħtieġ.
Segwi biss il-link ta 'hawn fuq u ittella' d-dokument PDF fuq il-websajt mill-kompjuter billi tuża l-buttuna "Agħżel fajl" jew min-netwerk - b'referenza. - Fil-lista li tinżel "Agħżel il-lingwa OCR" Agħżel il-lingwa tad-dokument importat.
Imbagħad ibda l-proċess tar-rikonoxximent tat-test billi tikklikkja fuq il-buttuna "Ibda OCR!". - Fi tmiem l-ipproċessar tal-fajl, aqra r-riżultat fil-qasam Riżultat OCR'ed u kklikkja "Niżżel"tniżżel id-dokument TXT lest.
Jekk inti sempliċiment teħtieġ li estratt it-test mill-PDF u fl-istess ħin l-ifformattjar finali tiegħu mhuwiex daqstant importanti, OCR.Space hija għażla tajba. L-unika ħaġa hi li d-dokument għandu jkun "monolingwi", billi r-rikonoxximent ta 'żewġ lingwi jew aktar fl-istess ħin mhuwiex previst fis-servizz.
Ara wkoll: Analogi b'xejn ta 'FineReader
L-istima ta 'l-għodod online ippreżentati fl-artiklu, għandu jkun innutat li FineReader Online minn ABBYY tieħu ħsieb il-funzjoni OCR bl-aktar mod preċiż u effiċjenti. Jekk l-eżattezza massima tar-rikonoxximent tat-test hija importanti għalik, huwa aħjar li tikkunsidra din l-għażla speċifikament. Iżda x'aktarx, inti wkoll ikollok tħallas għaliha.
Jekk trid tiddiżjonalizza dokumenti żgħar u int lest biex tikkoreġi b'mod indipendenti l-iżbalji fis-servizz, huwa rrakkomandat li tuża NewOCR, OCR.Space jew OCR Free Online.