Միշտ հեռու է միշտ հնարավոր է տեքստը PDF ֆայլից հանել սովորական կրկնօրինակման միջոցով: Հաճախ նման փաստաթղթերի էջերը սկանավորված են իրենց թղթային տարբերակների բովանդակությամբ: Նման ֆայլերը լիովին խմբագրելի տեքստային տվյալների վերափոխելու համար օգտագործվում են օպտիկական բնույթի ճանաչման (OCR) գործառույթով հատուկ ծրագրեր:
Նման որոշումները շատ դժվար է իրականացնել, և, հետևաբար, մեծ ծախսեր կան: Եթե դուք պետք է պարբերաբար PDF- ն ընդունեք տեքստը, ապա ցանկալի է ձեռք բերել համապատասխան ծրագիր: Հազվագյուտ դեպքերում ավելի տրամաբանական կլինի օգտագործել նման առցանց գործառույթներով մատչելի առցանց ծառայություններից մեկը:
Ինչպես ճանաչել տեքստը PDF- ից առցանց
Իհարկե, OCR առցանց ծառայությունների առանձնահատկությունների շրջանակը, համեմատած լիարժեք աշխատասեղանի լուծումների հետ, ավելի սահմանափակ է: Բայց դուք կարող եք նաև աշխատել նման ռեսուրսների հետ `կամ անվճար կամ անվանական վարձավճարով: Հիմնական բանը այն է, որ իրենց հիմնական խնդիրը, մասնավորապես `տեքստի ճանաչումը, համապատասխան վեբ ծրագրերը նույնպես հաղթահարվում են:
Մեթոդ 1. ABBYY FineReader առցանց
Ծառայությունների զարգացման ընկերությունը օպտիկական փաստաթղթերի ճանաչման ոլորտում առաջատարներից է: ABBYY FineReader- ը Windows- ի և Mac- ի համար հզոր լուծում է PDF- ը տեքստի վերափոխելու և դրա հետ հետագա աշխատանքի համար:
Ծրագրի վեբ վրա հիմնված անալոգը, անշուշտ, գործառութային առումով զիջում է դրան: Այնուամենայնիվ, ծառայությունը կարող է ճանաչել տեքստը սկաներից և լուսանկարներից ավելի քան 190 լեզուներով: Փոխարկեք PDF ֆայլերը Word, Excel և այլն:
ABBYY FineReader առցանց առցանց ծառայություն
- Նախքան գործիքի հետ աշխատելը, ստեղծեք հաշիվ կայքում կամ մուտք գործեք ձեր Facebook, Google կամ Microsoft հաշիվ:
Լիցենզիայի պատուհանի անցնելու համար կտտացրեք կոճակը «Մուտք» ընտրացանկի վերևի բարում: - Մտնելուց հետո կոճակը ներմուծեք ցանկալի PDF-փաստաթուղթը FineReader- ի մեջ «Վերբեռնեք ֆայլեր».
Այնուհետև կտտացրեք "Ընտրեք էջի համարները" և նշեք տեքստի ճանաչման համար ցանկալի միջակայքը: - Հաջորդը ընտրեք փաստաթղթում առկա լեզուները, արդյունքում ստացված ֆայլի ձևաչափը և կտտացրեք կոճակին «Ճանաչել».
- Մշակելուց հետո, որի տևողությունը ամբողջությամբ կախված է փաստաթղթի ծավալից, կարող եք ներբեռնել պատրաստի ֆայլը տեքստային տվյալներով `պարզապես կտտացնելով դրա անունը:
Կամ, արտահանեք այն մատչելի ամպային ծառայություններից մեկին:
Ծառայությունը հավանաբար առանձնանում է տեքստի ճանաչման առավել ճշգրիտ ալգորիթմներով `պատկերների և PDF ֆայլերի վրա: Բայց, ցավոք, դրա անվճար օգտագործումը սահմանափակվում է ամսական մշակված հինգ էջով: Ավելի ծավալուն փաստաթղթերի հետ աշխատելու համար ստիպված կլինեք գնել տարեկան բաժանորդագրություն:
Այնուամենայնիվ, եթե OCR- ը հազվադեպ է անհրաժեշտ, ABBYY FineReader Online- ը փոքր PDF ֆայլերից տեքստը հանելու հիանալի տարբերակ է:
Մեթոդ 2` անվճար առցանց OCR
Պարզ և հարմարավետ ծառայություն տեքստը թվայնացնելու համար: Առանց գրանցման, ռեսուրսը թույլ է տալիս Ձեզ մեկ ժամում ճանաչել 15 ամբողջական PDF էջ: Անվճար առցանց OCR- ն ամբողջությամբ աշխատում է փաստաթղթերով 46 լեզուներով և առանց թույլտվության աջակցում է տեքստի արտահանման երեք ձևաչափ ՝ DOCX, XLSX և TXT:
Գրանցվելիս օգտագործողը հնարավորություն է տալիս մշակել բազմաշերտ փաստաթղթեր, բայց այդ նույն էջերի անվճար թիվը սահմանափակվում է 50 միավորով:
OCR առցանց անվճար ծառայություն
- Տեքստը PDF- ից որպես «հյուր» ճանաչելու համար, առանց ռեսուրսների թույլտվության, օգտագործեք համապատասխան ձևը կայքի հիմնական էջում:
Ընտրեք ցանկալի փաստաթուղթը, օգտագործելով կոճակը Ֆայլնշեք տեքստի հիմնական լեզուն, ելքային ձևաչափը, ապա սպասեք, որ ֆայլը բեռնվի և կտտացնի Փոխարկել. - Թվայնացման գործընթացի ավարտին կտտացրեք "Ներբեռնեք ելքային ֆայլը" ավարտված փաստաթուղթը համակարգչով տեքստով փրկելու համար:
Լիազորված օգտագործողների համար գործողությունների հաջորդականությունը մի փոքր այլ է:
- Օգտագործեք կոճակը «Գրանցում» կամ «Մուտք» ընտրացանկի վերևի բարում, համապատասխանաբար, ստեղծել անվճար առցանց OCR հաշիվ կամ մուտք գործել դրան:
- Theանաչման վահանակում թույլտվությունից հետո պահեք բանալին CTRLընտրված ցուցակից ընտրեք աղբյուրի փաստաթղթի մինչև երկու լեզու:
- Նշեք տեքստը PDF- ից հանելու հետագա տարբերակները և կտտացրեք Ընտրեք ֆայլ փաստաթուղթը ծառայությունում վերբեռնելու համար:
Այնուհետև, ճանաչումը սկսելու համար կտտացրեք Փոխարկել. - Փաստաթղթի մշակման ավարտին կտտացրեք համապատասխան սյունակում ելքային ֆայլի անվանման հղմանը:
Recognitionանաչման արդյունքն անմիջապես կպահվի ձեր համակարգչի հիշողության մեջ:
Եթե ձեզ հարկավոր է փոքր տեքստային փաստաթղթից հանել տեքստը, կարող եք ապահով դիմել ՝ վերը նշված գործիքը օգտագործելու համար: Ծավալուն ֆայլերի հետ աշխատելու համար ստիպված կլինեք ձեռք բերել լրացուցիչ նիշ Free Online OCR- ում կամ օգտագործել մեկ այլ լուծում:
Մեթոդ 3. NewOCR
Լիովին անվճար OCR ծառայություն, որը թույլ է տալիս ձեզ տեքստ դուրս բերել գրեթե ցանկացած գրաֆիկական և էլեկտրոնային փաստաթղթերից, ինչպիսիք են DjVu- ն և PDF- ը: Ռեսուրսը չի սահմանում ճանաչված ֆայլերի չափի և քանակի սահմանափակումներ, չի պահանջում գրանցում և առաջարկում է հարակից գործառույթների լայն տեսականի:
NewOCR- ն աջակցում է 106 լեզուների և կարող է ճիշտ մշակել նույնիսկ անորակ փաստաթղթերի սկաներ: Հնարավոր է ձեռքով ընտրել տեքստի ճանաչման տարածքը ֆայլի էջում:
NewOCR առցանց ծառայություն
- Այսպիսով, դուք կարող եք սկսել մի ռեսուրսի հետ աշխատել անմիջապես, առանց ավելորդ գործողություններ կատարելու անհրաժեշտության:
Հիմնական էջում անմիջապես կա փաստաթուղթ կայք ներմուծելու համար: Նիշք NewOCR- ում ֆայլ վերբեռնելու համար օգտագործեք կոճակը «Ընտրեք ֆայլը» բաժնում "Ընտրեք ձեր ֆայլը". Հետո դաշտում "Recանաչման լեզու (ներ) ը" նշեք սկզբնաղբյուրի մեկ կամ մի քանի լեզուներ, ապա կտտացրեք «Վերբեռնեք + OCR». - Սահմանեք ձեր նախընտրելի ճանաչման կարգավորումները, ընտրեք այն էջը, որով ցանկանում եք քաղել տեքստը և սեղմել կոճակին OCR.
- Մի փոքր պտտեք էջը և գտեք կոճակը «Ներբեռնում».
Կտտացրեք այն և բացվող ցուցակի մեջ ընտրեք փաստաթղթի պահանջվող ձևաչափը ներբեռնելու համար: Դրանից հետո արդյունահանված տեքստով պատրաստված ֆայլը ներբեռնելու է ձեր համակարգիչ:
Գործիքը հարմար է, և բավականին բարձր որակը ճանաչում է բոլոր նիշերը: Այնուամենայնիվ, ներմուծված PDF փաստաթղթի յուրաքանչյուր էջի մշակումը պետք է սկսվի ինքնուրույն, և այն ցուցադրվում է առանձին ֆայլով: Դուք, իհարկե, կարող եք անմիջապես պատճենել ճանաչման արդյունքները clipboard- ում և դրանք համատեղել ուրիշների հետ:
Այնուամենայնիվ, հաշվի առնելով վերը նկարագրված նրբերանգը, շատ դժվար է NewOCR- ի միջոցով մեծ քանակությամբ տեքստ արդյունահանել: Փոքր ֆայլերով, ծառայությունը պատռվում է խայթոցով:
Մեթոդ 4. OCR.Space
Տեքստը թվայնացնելու պարզ և հասկանալի ռեսուրս, այն թույլ է տալիս ճանաչել PDF փաստաթղթերը և արդյունքը թողարկել TXT ֆայլ: Էջերի քանակի սահմանափակում չի նախատեսվում: Միակ սահմանափակումն այն է, որ մուտքային փաստաթղթի չափը չպետք է գերազանցի 5 մեգաբայթ:
OCR.Space առցանց ծառայություն
- Գրանցվել գործիքի հետ աշխատելու համար անհրաժեշտ չէ:
Պարզապես հետևեք վերը նշված հղմանը և կոճակը օգտագործող համակարգչից կայքէջը վերբեռնեք PDF փաստաթուղթը «Ընտրեք ֆայլը» կամ ցանցից `հղումով: - Բացվող ցուցակի մեջ "Ընտրիր OCR լեզուն" Ընտրեք ներմուծված փաստաթղթի լեզուն:
Դրանից հետո սկսեք տեքստի ճանաչման գործընթացը `սեղմելով կոճակը «Սկսեք OCR»:. - Ֆայլի մշակման վերջում կարդացեք արդյունքը դաշտում OCR- ի արդյունքը և կտտացրեք «Ներբեռնում»ավարտված TXT փաստաթուղթը ներբեռնելու համար:
Եթե պարզապես անհրաժեշտ է տեքստը PDF- ից հանել, և միևնույն ժամանակ դրա վերջնական ձևաչափումը ամենևին էլ կարևոր չէ, OCR.Space- ը լավ ընտրություն է: Միակ բանը այն է, որ փաստաթուղթը պետք է լինի «միալեզու», քանի որ ծառայության մեջ միևնույն ժամանակ երկու կամ ավելի լեզուների ճանաչում չի նախատեսվում:
Տե՛ս նաև `FineReader- ի անվճար անալոգներ
Գնահատելով հոդվածում ներկայացված առցանց գործիքները, հարկ է նշել, որ ABBYY- ից FineReader Online- ը առավել ճշգրիտ և արդյունավետ կատարում է OCR գործառույթը: Եթե ձեզ համար կարևոր է տեքստի ճանաչման առավելագույն ճշգրտությունը, ապա ավելի լավ է հատուկ դիտարկել այս տարբերակը: Բայց, ամենայն հավանականությամբ, դուք նույնպես ստիպված կլինեք վճարել դրա համար:
Եթե Ձեզ անհրաժեշտ է թվայնացնել փոքր փաստաթղթերը, և պատրաստ եք ինքնուրույն շտկել ծառայության ընթացքում սխալները, խորհուրդ է տրվում օգտագործել NewOCR, OCR.Space կամ Free Online OCR: