Այս հոդվածը լրացում կլինի նախորդից (//pcpro100.info/skanirovanie-teksta/), և ավելի մանրամասն կներկայացնի ուղղակի տեքստի ճանաչման էությունը:
Եկեք սկսենք այն բուն էությունից, որը շատ օգտվողներ ամբողջությամբ չեն հասկանում:
Գիրք, թերթ, ամսագիր և այլն զննելուց հետո դուք ստանում եք մի շարք նկարներ (այսինքն ՝ գրաֆիկական ֆայլեր, ոչ տեքստային ֆայլեր), որոնք դուք պետք է ճանաչեք հատուկ ծրագրի մեջ (սրա համար լավագույններից մեկը ABBYY FineReader է): Recանաչում. Սա այն է, գրաֆիկական տեքստից տեքստի ստացման գործընթացը, և հենց այս գործընթացն է, որ մենք ավելի մանրամասն նկարագրելու ենք:
Իմ օրինակում ես կվերցնեմ այս կայքի սքրինշոթը և կփորձեմ տեքստ ստանալ դրանից:
1) ֆայլ բացելը
Բացեք այն նկարը (ներ) ը, որը մենք նախատեսում ենք ճանաչել:
Ի դեպ, այստեղ պետք է նշել, որ դուք կարող եք բացել ոչ միայն պատկերի ձևաչափեր, այլև, օրինակ, DJVU և PDF ֆայլեր: Սա թույլ կտա արագորեն ճանաչել ամբողջ գիրքը, որը ցանցում է, որը սովորաբար տարածվում է այս ձևաչափերով:
2) խմբագրում
Անմիջապես համաձայնել ինքնորոշման հետ, այնքան էլ իմաստ չունի: Եթե, իհարկե, դուք ունեք մի գիրք, որում կա միայն տեքստ, չկան նկարներ և ափսեներ, գումարած այն սկանավորվում է գերազանց որակով, ապա կարող եք: Այլ դեպքերում, ավելի լավ է ձեռնամուխ լինել բոլոր ոլորտները:
Սովորաբար նախ պետք է էջից հեռացնել ավելորդ տարածքները: Դա անելու համար կտտացրեք վահանակի վրա խմբագրման կոճակը:
Այնուհետև ձեզ հարկավոր է թողնել միայն այն տարածքը, որի հետ ցանկանում եք ավելի երկար աշխատել: Դա անելու համար կա գործիք `անցանկալի սահմանները մանրացնելու համար: Աջ սյունակում ընտրեք ռեժիմը բերքը.
Հաջորդը, ընտրեք այն տարածքը, որը ցանկանում եք հեռանալ: Ստորև նկարում այն ընդգծված է կարմիրով:
Ի դեպ, եթե ունեք մի քանի նկար բաց, ապա կտրումը կարող է կիրառվել միանգամից բոլոր պատկերների վրա: Հարմար է չկտրել յուրաքանչյուրը անհատապես: Խնդրում ենք նկատի ունենալ, այս վահանակի վերջում կա ևս մեկ հիանալի գործիք `ռետին. Օգտագործելով այն, դուք կարող եք ջնջել անցանկալի բծերը, էջի համարները, ակնոցները, ավելորդ հատուկ նիշերը և առանձին բաժինները նկարից:
Կտտացնելով եզրերը եզրերը կտրելուց հետո, ձեր բնօրինակ պատկերը պետք է փոխվի. Մնում է միայն աշխատանքային տարածքը:
Այնուհետև կարող եք դուրս գալ պատկերի խմբագրից:
3) լուսավորության տարածքներ
Բաց պատկերից վերևի վահանակի վրա կան փոքր ուղղանկյուններ, որոնք սահմանում են սկանավորման տարածքը: Դրանցից մի քանիսը կան, հակիրճ համարեք ամենատարածվածը:
Նկար - ծրագիրը չի ճանաչի այս տարածքը, այն պարզապես պատճենում է նշված ուղղանկյունը և տեղադրում այն ճանաչված փաստաթղթում:
Տեքստը այն հիմնական ոլորտն է, որի վրա կենտրոնանալու է ծրագիրը և կփորձեք տեքստ ստանալ նկարից: Այս օրինակը, որը մենք կներկայացնենք մեր օրինակում:
Ընտրությունից հետո տարածքը ներկված է բաց կանաչ գույնով: Այնուհետև կարող եք անցնել հաջորդ քայլին:
4) տեքստի ճանաչում
Բոլոր տարածքները սահմանելուց հետո կտտացրեք commandանկի վրա ճանաչելու հրամանը: Բարեբախտաբար, այս քայլում ոչ այլ ինչ է պետք:
Recանաչման ժամանակը կախված է ձեր փաստաթղթի էջերի քանակից և համակարգչի հզորությունից:
Միջին հաշվով, որակյալ սկանավորված մեկ ամբողջական էջը տևում է 10-20 վայրկյան: միջին համակարգչային հզորություն (այսօրվա ստանդարտներով):
5) Սխալը ստուգելիս
Ինչ էլ որ լինի նկարների սկզբնական որակը, սխալները սովորաբար միշտ մնում են ճանաչումից հետո: Միևնույն է, մինչ այժմ ոչ մի ծրագիր չի կարողացել ամբողջությամբ բացառել մարդկային աշխատանքը:
Կտտացրեք ստուգման տարբերակին, և ABBYY FineReader- ը կսկսի ձեզ մեկ առ մեկ ցուցադրել այն փաստաթղթում նշված տեղերը, որտեղ այն սայթաքել է: Ձեր խնդիրն է ՝ համեմատելով բնօրինակ պատկերը (ի դեպ, այս տեղը դա ձեզ ցույց կտա ընդլայնված տարբերակով) ճանաչման տարբերակի հետ `պատասխանը հաստատողի մեջ, կամ ուղղեք և հաստատեք: Այնուհետև ծրագիրը կանցնի հաջորդ դժվարին տեղը և այլն, մինչև ամբողջ փաստաթղթի ստուգումը:
Ընդհանուր առմամբ, այս գործընթացը կարող է լինել երկար և ձանձրալի ...
6) խնայողություն
ABBYY FineReader- ը առաջարկում է մի քանի տարբերակ ՝ ձեր աշխատանքը խնայելու համար: Ամենատարածվածը «ճշգրիտ պատճենն» է: Ի. ամբողջ փաստաթուղթը, դրա մեջ եղած տեքստը կձևակերպվի ինչպես աղբյուրում, այնպես էլ այն Word- ին փոխանցելու հարմար տարբերակ: Այսպես էլ արեցինք այս օրինակում:
Դրանից հետո ձեր ճանաչված տեքստը կտեսնեք ծանոթ Word փաստաթղթում: Կարծում եմ, որ իմաստ չունի հետագայում նկարել, թե ինչ անել դրա հետ ...
Այսպիսով, մենք օրինակ բերեցինք, թե ինչպես կարելի է նկարը պարզ տեքստ վերածել: Այս գործընթացը միշտ չէ, որ պարզ է և արագ:
Ամեն դեպքում, ամեն ինչ կախված կլինի աղբյուրի նկարի որակից, ձեր փորձից և համակարգչի արագությունից:
Լավ աշխատանք կատարեք: