Վաղ թե ուշ, յուրաքանչյուր ոք, ով հաճախ աշխատում է գրասենյակային ծրագրերով, բախվում է բնորոշ խնդրի ՝ գրքից, ամսագրից, թերթից տեքստը սկանավորելու համար, պարզապես թռուցիկներ, այնուհետև այդ նկարները տեքստի ձևաչափով, օրինակ ՝ «Word» փաստաթղթի վերածելու:
Դա անելու համար ձեզ հարկավոր է սկաներ և հատուկ ծրագիր `տեքստը ճանաչելու համար: Այս հոդվածում կքննարկվի FineReader- ի անվճար գործընկերոջը -Սեպագիր (FineReader- ում ճանաչման մասին - տես այս հոդվածը):
Սկսենք ...
Բովանդակություն
- 1. CuneiForm ծրագրի առանձնահատկությունները, առանձնահատկությունները
- 2. Տեքստի ճանաչման օրինակ
- 3. Փաթեթի տեքստի ճանաչում
- 4. Եզրակացություններ
1. CuneiForm ծրագրի առանձնահատկությունները, առանձնահատկությունները
Սեպագիր
Դուք կարող եք ներբեռնել այն մշակողի կայքից ՝ //cognitiveforms.com/
Բաց կոդով տեքստի ճանաչման ծրագիր: Բացի այդ, այն աշխատում է Windows- ի բոլոր տարբերակներում ՝ XP, Vista, 7, 8, ինչը հաճելի է: Ավելին, ավելացնել ծրագրի ամբողջական ռուսերեն թարգմանությունը:
Կողմ:
- աշխարհի 20 ամենատարածված լեզուներում տեքստի ճանաչումը (ինքնուրույն անգլերեն և ռուսերեն ընդգրկված է այս թվով).
- հսկայական աջակցություն տարբեր տպագիր տառատեսակների համար;
- ստուգեք ճանաչված տեքստի բառարանը.
- աշխատանքի արդյունքների պահպանման ունակությունը մի քանի եղանակներով.
- փաստաթղթի կառուցվածքի պահպանում.
- Մեծ աջակցություն և սեղանի ճանաչում:
Դեմ:
- չի ապահովում չափազանց մեծ փաստաթղթեր և ֆայլեր (400 dpi- ից ավելի);
- ուղղակիորեն չի պաշտպանում սկաներների որոշակի տեսակներ (լավ, դա մեծ գործարք չէ, սկաների հատուկ համակարգում ներառված է սկաների սկավառակների համար);
- դիզայնը չի փայլում (բայց ում պետք է, եթե ծրագիրը լիովին լուծում է խնդիրը):
2. Տեքստի ճանաչման օրինակ
Ենթադրում ենք, որ դուք արդեն ստացել եք ճանաչման համար անհրաժեշտ նկարները (այնտեղ սկանավորվել է, կամ ինտերնետում pdf / djvu ձևաչափով գիրք եք ներբեռնել և դրանցից հանել անհրաժեշտ նկարները: Ինչպե՞ս դա անել, տես այս հոդվածը):
1) Բացեք ցանկալի պատկերը CuineForm ծրագրում (ֆայլ / բաց կամ «Cntrl + O»):
2) ճանաչումը սկսելու համար. Նախ պետք է ընտրեք տարբեր ոլորտներ. Տեքստ, նկարներ, սեղաններ և այլն: Cuneiform ծրագրում դա կարելի է անել ոչ միայն ձեռքով, այլև ինքնաբերաբար! Դա անելու համար կտտացրեք պատուհանի վերին վահանակի վրա «դասավորությունը» կոճակին:
3) 10-15 վայրկյան հետո: Ծրագիրը ինքնաբերաբար կներկայացնի տարբեր գույներով բոլոր ոլորտները: Օրինակ, տեքստի տարածքը ընդգծված է կապույտ գույնով: Ի դեպ, նա ճիշտ և արդարորեն կարևորեց բոլոր ոլորտները: Անկեղծ ասած, ես նրա կողմից այդպիսի արագ և ճիշտ արձագանք չէի սպասում ...
4) Նրանց համար, ովքեր չեն վստահում ավտոմատ դասավորությունը, կարող եք օգտագործել ձեռնարկ: Դա անելու համար կա գործիքագոտու (տե՛ս ստորև նկարը), որի շնորհիվ կարող եք ընտրել ՝ տեքստ, սեղան, նկար: Տեղափոխեք, խոշորացրեք / նվազեցրեք նախնական պատկերը, բերքերը կտրեք: Ընդհանրապես, լավ հավաքածու:
5) Բոլոր ոլորտները նշելուց հետո մենք կարող ենք անցնել դրան ճանաչում. Դա անելու համար պարզապես կտտացրեք նույն անունով կոճակը, ինչպես ստորեւ նկարում:
6) բառացիորեն 10-20 վայրկյանում: Դուք կտեսնեք փաստաթուղթ Microsoft Word- ում `ճանաչված տեքստով: Հետաքրքիր է, որ այս օրինակի համար տեքստում, իհարկե, եղել են սխալներ, բայց դրանցից շատ քչերն են: Ավելին, հաշվի առնելով, թե որպիսի անպատրաստ որակ է եղել աղբյուրի նյութը `նկար:
Արագությունն ու որակը բավականին համեմատելի են FineReader- ի հետ:
3. Փաթեթի տեքստի ճանաչում
Այս ծրագրի գործառույթը կարող է օգտակար լինել, երբ դուք պետք է ճանաչեք ոչ թե մեկ նկար, այլ միանգամից մի քանի: Խմբաքանակի ճանաչումը սկսելու դյուրանցումը սովորաբար թաքնված է մեկնարկի ցանկում:
1) Ծրագիրը բացելուց հետո անհրաժեշտ է ստեղծել նոր փաթեթ կամ բացել նախկինում պահպանվածը: Մեր օրինակում ստեղծեք նորը:
2) Հաջորդ քայլում մենք այն տալիս ենք անուն, նախընտրելիորեն, որը հիշեցնում է այն, ինչ վրան պահվում է վեց ամիս անց:
3) Հաջորդը, ընտրեք փաստաթղթերի լեզուն (ռուս-անգլերեն), նշեք, թե արդյոք ձեր սկանավորված նյութում կան նկարներ և սեղաններ:
4) Այժմ դուք պետք է նշեք այն թղթապանակը, որում գտնվում են ճանաչման ֆայլերը: Ի դեպ, հետաքրքիրն այն է, որ ծրագիրը ինքնին կգտնի բոլոր նկարներն ու գրաֆիկական այլ ֆայլերը, որոնք նա կարող է ճանաչել և ավելացնել դրանք նախագծում: Դուք պարզապես պետք է հեռացնեք լրացուցիչը:
5) Հաջորդ քայլը կարևոր չէ `ճանաչելուց հետո ընտրել, թե ինչ անել աղբյուրի ֆայլերի հետ: Ես խորհուրդ եմ տալիս ընտրել «ոչինչ չանել» վանդակը:
6) Մնում է միայն ընտրել այն ձևաչափը, որով կպահպանվի ճանաչված փաստաթուղթը: Կան մի քանի տարբերակ.
- rtf - ֆայլ բառային փաստաթղթից, որը բացվում է բոլոր հանրաճանաչ գրասենյակների կողմից (ներառյալ անվճար գրասենյակները, ծրագրերի հղումը);
- txt - տեքստի ձևաչափ, դրանում կարող եք պահպանել միայն տեքստը, նկարները և աղյուսակները չեն կարող լինել;
- հտմ - հիպերտեքստի էջ, հարմար, եթե դուք սկանավորում և ճանաչում եք կայքի ֆայլերը: Մենք դա կընտրենք մեր օրինակում:
7) «Ավարտել» կոճակը սեղմելուց հետո կսկսվի ձեր նախագծի մշակման գործընթացը:
8) Ծրագիրը գործում է բավականին արագ: Recognitionանաչելուց հետո ձեր առջև կհայտնվի htm ֆայլերով ներդիր: Եթե կտտացրեք այդպիսի ֆայլը, զննարկիչը սկսվում է, որտեղ կարող եք տեսնել արդյունքները: Ի դեպ, փաթեթը կարող է պահպանվել դրա հետ հետագա աշխատանքի համար:
9) Ինչպես տեսնում եք, արդյունքները աշխատանքը շատ տպավորիչ է: Ծրագիրը հեշտությամբ ճանաչեց նկարը, և դրա տակ տեքստը հեշտությամբ ճանաչվեց: Չնայած այն հանգամանքին, որ ծրագիրը անվճար է, այն հիմնականում հիանալի է:
4. Եզրակացություններ
Եթե դուք հաճախ չեք փաստաթղթեր սկանավորում և ճանաչում, ապա FineReader ծրագիրը գնելը, հավանաբար, իմաստ չունի: Առաջադրանքների մեծ մասը հեշտությամբ վարվում է CuneiForm- ի կողմից:
Մյուս կողմից, նա նույնպես ունի թերություններ:
Նախ ՝ արդյունքը խմբագրելու և ստուգելու համար չափազանց քիչ գործիքներ կան: Երկրորդ, երբ դուք պետք է ճանաչեք շատ նկարներ, FineReader- ում ավելի հարմար է անմիջապես դիտել նախագծում ավելացված ամեն ինչ աջ սյունակում. Արագ հեռացնել ավելորդները, կատարել շտկումներ և այլն: Եվ երրորդ, CuneiForm- ը կորցնում է որպես փաստաթղթերի ճանաչում: Ես պետք է որ փաստաթուղթը մտցնեմ `սխալները խմբագրեմ, կետադրական նշաններ դնեն, չակերտներ և այլն:
Դա բոլորն են: Գիտե՞ք որևէ այլ արժանի անվճար տեքստի ճանաչման ծրագիր: