Textանաչել տեքստը PDF ֆայլով առցանց

Pin
Send
Share
Send


Միշտ հեռու է միշտ հնարավոր է տեքստը PDF ֆայլից հանել սովորական կրկնօրինակման միջոցով: Հաճախ նման փաստաթղթերի էջերը սկանավորված են իրենց թղթային տարբերակների բովանդակությամբ: Նման ֆայլերը լիովին խմբագրելի տեքստային տվյալների վերափոխելու համար օգտագործվում են օպտիկական բնույթի ճանաչման (OCR) գործառույթով հատուկ ծրագրեր:

Նման որոշումները շատ դժվար է իրականացնել, և, հետևաբար, մեծ ծախսեր կան: Եթե ​​դուք պետք է պարբերաբար PDF- ն ընդունեք տեքստը, ապա ցանկալի է ձեռք բերել համապատասխան ծրագիր: Հազվագյուտ դեպքերում ավելի տրամաբանական կլինի օգտագործել նման առցանց գործառույթներով մատչելի առցանց ծառայություններից մեկը:

Ինչպես ճանաչել տեքստը PDF- ից առցանց

Իհարկե, OCR առցանց ծառայությունների առանձնահատկությունների շրջանակը, համեմատած լիարժեք աշխատասեղանի լուծումների հետ, ավելի սահմանափակ է: Բայց դուք կարող եք նաև աշխատել նման ռեսուրսների հետ `կամ անվճար կամ անվանական վարձավճարով: Հիմնական բանը այն է, որ իրենց հիմնական խնդիրը, մասնավորապես `տեքստի ճանաչումը, համապատասխան վեբ ծրագրերը նույնպես հաղթահարվում են:

Մեթոդ 1. ABBYY FineReader առցանց

Ծառայությունների զարգացման ընկերությունը օպտիկական փաստաթղթերի ճանաչման ոլորտում առաջատարներից է: ABBYY FineReader- ը Windows- ի և Mac- ի համար հզոր լուծում է PDF- ը տեքստի վերափոխելու և դրա հետ հետագա աշխատանքի համար:

Ծրագրի վեբ վրա հիմնված անալոգը, անշուշտ, գործառութային առումով զիջում է դրան: Այնուամենայնիվ, ծառայությունը կարող է ճանաչել տեքստը սկաներից և լուսանկարներից ավելի քան 190 լեզուներով: Փոխարկեք PDF ֆայլերը Word, Excel և այլն:

ABBYY FineReader առցանց առցանց ծառայություն

  1. Նախքան գործիքի հետ աշխատելը, ստեղծեք հաշիվ կայքում կամ մուտք գործեք ձեր Facebook, Google կամ Microsoft հաշիվ:

    Լիցենզիայի պատուհանի անցնելու համար կտտացրեք կոճակը «Մուտք» ընտրացանկի վերևի բարում:
  2. Մտնելուց հետո կոճակը ներմուծեք ցանկալի PDF-փաստաթուղթը FineReader- ի մեջ «Վերբեռնեք ֆայլեր».

    Այնուհետև կտտացրեք "Ընտրեք էջի համարները" և նշեք տեքստի ճանաչման համար ցանկալի միջակայքը:
  3. Հաջորդը ընտրեք փաստաթղթում առկա լեզուները, արդյունքում ստացված ֆայլի ձևաչափը և կտտացրեք կոճակին «Ճանաչել».
  4. Մշակելուց հետո, որի տևողությունը ամբողջությամբ կախված է փաստաթղթի ծավալից, կարող եք ներբեռնել պատրաստի ֆայլը տեքստային տվյալներով `պարզապես կտտացնելով դրա անունը:

    Կամ, արտահանեք այն մատչելի ամպային ծառայություններից մեկին:

Ծառայությունը հավանաբար առանձնանում է տեքստի ճանաչման առավել ճշգրիտ ալգորիթմներով `պատկերների և PDF ֆայլերի վրա: Բայց, ցավոք, դրա անվճար օգտագործումը սահմանափակվում է ամսական մշակված հինգ էջով: Ավելի ծավալուն փաստաթղթերի հետ աշխատելու համար ստիպված կլինեք գնել տարեկան բաժանորդագրություն:

Այնուամենայնիվ, եթե OCR- ը հազվադեպ է անհրաժեշտ, ABBYY FineReader Online- ը փոքր PDF ֆայլերից տեքստը հանելու հիանալի տարբերակ է:

Մեթոդ 2` անվճար առցանց OCR

Պարզ և հարմարավետ ծառայություն տեքստը թվայնացնելու համար: Առանց գրանցման, ռեսուրսը թույլ է տալիս Ձեզ մեկ ժամում ճանաչել 15 ամբողջական PDF էջ: Անվճար առցանց OCR- ն ամբողջությամբ աշխատում է փաստաթղթերով 46 լեզուներով և առանց թույլտվության աջակցում է տեքստի արտահանման երեք ձևաչափ ՝ DOCX, XLSX և TXT:

Գրանցվելիս օգտագործողը հնարավորություն է տալիս մշակել բազմաշերտ փաստաթղթեր, բայց այդ նույն էջերի անվճար թիվը սահմանափակվում է 50 միավորով:

OCR առցանց անվճար ծառայություն

  1. Տեքստը PDF- ից որպես «հյուր» ճանաչելու համար, առանց ռեսուրսների թույլտվության, օգտագործեք համապատասխան ձևը կայքի հիմնական էջում:

    Ընտրեք ցանկալի փաստաթուղթը, օգտագործելով կոճակը Ֆայլնշեք տեքստի հիմնական լեզուն, ելքային ձևաչափը, ապա սպասեք, որ ֆայլը բեռնվի և կտտացնի Փոխարկել.
  2. Թվայնացման գործընթացի ավարտին կտտացրեք "Ներբեռնեք ելքային ֆայլը" ավարտված փաստաթուղթը համակարգչով տեքստով փրկելու համար:

Լիազորված օգտագործողների համար գործողությունների հաջորդականությունը մի փոքր այլ է:

  1. Օգտագործեք կոճակը «Գրանցում» կամ «Մուտք» ընտրացանկի վերևի բարում, համապատասխանաբար, ստեղծել անվճար առցանց OCR հաշիվ կամ մուտք գործել դրան:
  2. Theանաչման վահանակում թույլտվությունից հետո պահեք բանալին CTRLընտրված ցուցակից ընտրեք աղբյուրի փաստաթղթի մինչև երկու լեզու:
  3. Նշեք տեքստը PDF- ից հանելու հետագա տարբերակները և կտտացրեք Ընտրեք ֆայլ փաստաթուղթը ծառայությունում վերբեռնելու համար:

    Այնուհետև, ճանաչումը սկսելու համար կտտացրեք Փոխարկել.
  4. Փաստաթղթի մշակման ավարտին կտտացրեք համապատասխան սյունակում ելքային ֆայլի անվանման հղմանը:

    Recognitionանաչման արդյունքն անմիջապես կպահվի ձեր համակարգչի հիշողության մեջ:

Եթե ​​ձեզ հարկավոր է փոքր տեքստային փաստաթղթից հանել տեքստը, կարող եք ապահով դիմել ՝ վերը նշված գործիքը օգտագործելու համար: Ծավալուն ֆայլերի հետ աշխատելու համար ստիպված կլինեք ձեռք բերել լրացուցիչ նիշ Free Online OCR- ում կամ օգտագործել մեկ այլ լուծում:

Մեթոդ 3. NewOCR

Լիովին անվճար OCR ծառայություն, որը թույլ է տալիս ձեզ տեքստ դուրս բերել գրեթե ցանկացած գրաֆիկական և էլեկտրոնային փաստաթղթերից, ինչպիսիք են DjVu- ն և PDF- ը: Ռեսուրսը չի սահմանում ճանաչված ֆայլերի չափի և քանակի սահմանափակումներ, չի պահանջում գրանցում և առաջարկում է հարակից գործառույթների լայն տեսականի:

NewOCR- ն աջակցում է 106 լեզուների և կարող է ճիշտ մշակել նույնիսկ անորակ փաստաթղթերի սկաներ: Հնարավոր է ձեռքով ընտրել տեքստի ճանաչման տարածքը ֆայլի էջում:

NewOCR առցանց ծառայություն

  1. Այսպիսով, դուք կարող եք սկսել մի ռեսուրսի հետ աշխատել անմիջապես, առանց ավելորդ գործողություններ կատարելու անհրաժեշտության:

    Հիմնական էջում անմիջապես կա փաստաթուղթ կայք ներմուծելու համար: Նիշք NewOCR- ում ֆայլ վերբեռնելու համար օգտագործեք կոճակը «Ընտրեք ֆայլը» բաժնում "Ընտրեք ձեր ֆայլը". Հետո դաշտում "Recանաչման լեզու (ներ) ը" նշեք սկզբնաղբյուրի մեկ կամ մի քանի լեզուներ, ապա կտտացրեք «Վերբեռնեք + OCR».
  2. Սահմանեք ձեր նախընտրելի ճանաչման կարգավորումները, ընտրեք այն էջը, որով ցանկանում եք քաղել տեքստը և սեղմել կոճակին OCR.
  3. Մի փոքր պտտեք էջը և գտեք կոճակը «Ներբեռնում».

    Կտտացրեք այն և բացվող ցուցակի մեջ ընտրեք փաստաթղթի պահանջվող ձևաչափը ներբեռնելու համար: Դրանից հետո արդյունահանված տեքստով պատրաստված ֆայլը ներբեռնելու է ձեր համակարգիչ:

Գործիքը հարմար է, և բավականին բարձր որակը ճանաչում է բոլոր նիշերը: Այնուամենայնիվ, ներմուծված PDF փաստաթղթի յուրաքանչյուր էջի մշակումը պետք է սկսվի ինքնուրույն, և այն ցուցադրվում է առանձին ֆայլով: Դուք, իհարկե, կարող եք անմիջապես պատճենել ճանաչման արդյունքները clipboard- ում և դրանք համատեղել ուրիշների հետ:

Այնուամենայնիվ, հաշվի առնելով վերը նկարագրված նրբերանգը, շատ դժվար է NewOCR- ի միջոցով մեծ քանակությամբ տեքստ արդյունահանել: Փոքր ֆայլերով, ծառայությունը պատռվում է խայթոցով:

Մեթոդ 4. OCR.Space

Տեքստը թվայնացնելու պարզ և հասկանալի ռեսուրս, այն թույլ է տալիս ճանաչել PDF փաստաթղթերը և արդյունքը թողարկել TXT ֆայլ: Էջերի քանակի սահմանափակում չի նախատեսվում: Միակ սահմանափակումն այն է, որ մուտքային փաստաթղթի չափը չպետք է գերազանցի 5 մեգաբայթ:

OCR.Space առցանց ծառայություն

  1. Գրանցվել գործիքի հետ աշխատելու համար անհրաժեշտ չէ:

    Պարզապես հետևեք վերը նշված հղմանը և կոճակը օգտագործող համակարգչից կայքէջը վերբեռնեք PDF փաստաթուղթը «Ընտրեք ֆայլը» կամ ցանցից `հղումով:
  2. Բացվող ցուցակի մեջ "Ընտրիր OCR լեզուն" Ընտրեք ներմուծված փաստաթղթի լեզուն:

    Դրանից հետո սկսեք տեքստի ճանաչման գործընթացը `սեղմելով կոճակը «Սկսեք OCR»:.
  3. Ֆայլի մշակման վերջում կարդացեք արդյունքը դաշտում OCR- ի արդյունքը և կտտացրեք «Ներբեռնում»ավարտված TXT փաստաթուղթը ներբեռնելու համար:

Եթե ​​պարզապես անհրաժեշտ է տեքստը PDF- ից հանել, և միևնույն ժամանակ դրա վերջնական ձևաչափումը ամենևին էլ կարևոր չէ, OCR.Space- ը լավ ընտրություն է: Միակ բանը այն է, որ փաստաթուղթը պետք է լինի «միալեզու», քանի որ ծառայության մեջ միևնույն ժամանակ երկու կամ ավելի լեզուների ճանաչում չի նախատեսվում:

Տե՛ս նաև `FineReader- ի անվճար անալոգներ

Գնահատելով հոդվածում ներկայացված առցանց գործիքները, հարկ է նշել, որ ABBYY- ից FineReader Online- ը առավել ճշգրիտ և արդյունավետ կատարում է OCR գործառույթը: Եթե ​​ձեզ համար կարևոր է տեքստի ճանաչման առավելագույն ճշգրտությունը, ապա ավելի լավ է հատուկ դիտարկել այս տարբերակը: Բայց, ամենայն հավանականությամբ, դուք նույնպես ստիպված կլինեք վճարել դրա համար:

Եթե ​​Ձեզ անհրաժեշտ է թվայնացնել փոքր փաստաթղթերը, և պատրաստ եք ինքնուրույն շտկել ծառայության ընթացքում սխալները, խորհուրդ է տրվում օգտագործել NewOCR, OCR.Space կամ Free Online OCR:

Pin
Send
Share
Send