Տեքստի ճանաչում: Անվճար ծրագիր - FineReader- ի անալոգ

Pin
Send
Share
Send

Վաղ թե ուշ, յուրաքանչյուր ոք, ով հաճախ աշխատում է գրասենյակային ծրագրերով, բախվում է բնորոշ խնդրի ՝ գրքից, ամսագրից, թերթից տեքստը սկանավորելու համար, պարզապես թռուցիկներ, այնուհետև այդ նկարները տեքստի ձևաչափով, օրինակ ՝ «Word» փաստաթղթի վերածելու:

Դա անելու համար ձեզ հարկավոր է սկաներ և հատուկ ծրագիր `տեքստը ճանաչելու համար: Այս հոդվածում կքննարկվի FineReader- ի անվճար գործընկերոջը -Սեպագիր (FineReader- ում ճանաչման մասին - տես այս հոդվածը):

Սկսենք ...

Բովանդակություն

  • 1. CuneiForm ծրագրի առանձնահատկությունները, առանձնահատկությունները
  • 2. Տեքստի ճանաչման օրինակ
  • 3. Փաթեթի տեքստի ճանաչում
  • 4. Եզրակացություններ

1. CuneiForm ծրագրի առանձնահատկությունները, առանձնահատկությունները

Սեպագիր

Դուք կարող եք ներբեռնել այն մշակողի կայքից ՝ //cognitiveforms.com/

Բաց կոդով տեքստի ճանաչման ծրագիր: Բացի այդ, այն աշխատում է Windows- ի բոլոր տարբերակներում ՝ XP, Vista, 7, 8, ինչը հաճելի է: Ավելին, ավելացնել ծրագրի ամբողջական ռուսերեն թարգմանությունը:

Կողմ:

- աշխարհի 20 ամենատարածված լեզուներում տեքստի ճանաչումը (ինքնուրույն անգլերեն և ռուսերեն ընդգրկված է այս թվով).

- հսկայական աջակցություն տարբեր տպագիր տառատեսակների համար;

- ստուգեք ճանաչված տեքստի բառարանը.

- աշխատանքի արդյունքների պահպանման ունակությունը մի քանի եղանակներով.

- փաստաթղթի կառուցվածքի պահպանում.

- Մեծ աջակցություն և սեղանի ճանաչում:

Դեմ:

- չի ապահովում չափազանց մեծ փաստաթղթեր և ֆայլեր (400 dpi- ից ավելի);

- ուղղակիորեն չի պաշտպանում սկաներների որոշակի տեսակներ (լավ, դա մեծ գործարք չէ, սկաների հատուկ համակարգում ներառված է սկաների սկավառակների համար);

- դիզայնը չի փայլում (բայց ում պետք է, եթե ծրագիրը լիովին լուծում է խնդիրը):

2. Տեքստի ճանաչման օրինակ

Ենթադրում ենք, որ դուք արդեն ստացել եք ճանաչման համար անհրաժեշտ նկարները (այնտեղ սկանավորվել է, կամ ինտերնետում pdf / djvu ձևաչափով գիրք եք ներբեռնել և դրանցից հանել անհրաժեշտ նկարները: Ինչպե՞ս դա անել, տես այս հոդվածը):

1) Բացեք ցանկալի պատկերը CuineForm ծրագրում (ֆայլ / բաց կամ «Cntrl + O»):

2) ճանաչումը սկսելու համար. Նախ պետք է ընտրեք տարբեր ոլորտներ. Տեքստ, նկարներ, սեղաններ և այլն: Cuneiform ծրագրում դա կարելի է անել ոչ միայն ձեռքով, այլև ինքնաբերաբար! Դա անելու համար կտտացրեք պատուհանի վերին վահանակի վրա «դասավորությունը» կոճակին:

3) 10-15 վայրկյան հետո: Ծրագիրը ինքնաբերաբար կներկայացնի տարբեր գույներով բոլոր ոլորտները: Օրինակ, տեքստի տարածքը ընդգծված է կապույտ գույնով: Ի դեպ, նա ճիշտ և արդարորեն կարևորեց բոլոր ոլորտները: Անկեղծ ասած, ես նրա կողմից այդպիսի արագ և ճիշտ արձագանք չէի սպասում ...

4) Նրանց համար, ովքեր չեն վստահում ավտոմատ դասավորությունը, կարող եք օգտագործել ձեռնարկ: Դա անելու համար կա գործիքագոտու (տե՛ս ստորև նկարը), որի շնորհիվ կարող եք ընտրել ՝ տեքստ, սեղան, նկար: Տեղափոխեք, խոշորացրեք / նվազեցրեք նախնական պատկերը, բերքերը կտրեք: Ընդհանրապես, լավ հավաքածու:

5) Բոլոր ոլորտները նշելուց հետո մենք կարող ենք անցնել դրան ճանաչում. Դա անելու համար պարզապես կտտացրեք նույն անունով կոճակը, ինչպես ստորեւ նկարում:

6) բառացիորեն 10-20 վայրկյանում: Դուք կտեսնեք փաստաթուղթ Microsoft Word- ում `ճանաչված տեքստով: Հետաքրքիր է, որ այս օրինակի համար տեքստում, իհարկե, եղել են սխալներ, բայց դրանցից շատ քչերն են: Ավելին, հաշվի առնելով, թե որպիսի անպատրաստ որակ է եղել աղբյուրի նյութը `նկար:

Արագությունն ու որակը բավականին համեմատելի են FineReader- ի հետ:

3. Փաթեթի տեքստի ճանաչում

Այս ծրագրի գործառույթը կարող է օգտակար լինել, երբ դուք պետք է ճանաչեք ոչ թե մեկ նկար, այլ միանգամից մի քանի: Խմբաքանակի ճանաչումը սկսելու դյուրանցումը սովորաբար թաքնված է մեկնարկի ցանկում:

1) Ծրագիրը բացելուց հետո անհրաժեշտ է ստեղծել նոր փաթեթ կամ բացել նախկինում պահպանվածը: Մեր օրինակում ստեղծեք նորը:

2) Հաջորդ քայլում մենք այն տալիս ենք անուն, նախընտրելիորեն, որը հիշեցնում է այն, ինչ վրան պահվում է վեց ամիս անց:

3) Հաջորդը, ընտրեք փաստաթղթերի լեզուն (ռուս-անգլերեն), նշեք, թե արդյոք ձեր սկանավորված նյութում կան նկարներ և սեղաններ:

4) Այժմ դուք պետք է նշեք այն թղթապանակը, որում գտնվում են ճանաչման ֆայլերը: Ի դեպ, հետաքրքիրն այն է, որ ծրագիրը ինքնին կգտնի բոլոր նկարներն ու գրաֆիկական այլ ֆայլերը, որոնք նա կարող է ճանաչել և ավելացնել դրանք նախագծում: Դուք պարզապես պետք է հեռացնեք լրացուցիչը:

5) Հաջորդ քայլը կարևոր չէ `ճանաչելուց հետո ընտրել, թե ինչ անել աղբյուրի ֆայլերի հետ: Ես խորհուրդ եմ տալիս ընտրել «ոչինչ չանել» վանդակը:

6) Մնում է միայն ընտրել այն ձևաչափը, որով կպահպանվի ճանաչված փաստաթուղթը: Կան մի քանի տարբերակ.

- rtf - ֆայլ բառային փաստաթղթից, որը բացվում է բոլոր հանրաճանաչ գրասենյակների կողմից (ներառյալ անվճար գրասենյակները, ծրագրերի հղումը);

- txt - տեքստի ձևաչափ, դրանում կարող եք պահպանել միայն տեքստը, նկարները և աղյուսակները չեն կարող լինել;

- հտմ - հիպերտեքստի էջ, հարմար, եթե դուք սկանավորում և ճանաչում եք կայքի ֆայլերը: Մենք դա կընտրենք մեր օրինակում:

7) «Ավարտել» կոճակը սեղմելուց հետո կսկսվի ձեր նախագծի մշակման գործընթացը:

8) Ծրագիրը գործում է բավականին արագ: Recognitionանաչելուց հետո ձեր առջև կհայտնվի htm ֆայլերով ներդիր: Եթե ​​կտտացրեք այդպիսի ֆայլը, զննարկիչը սկսվում է, որտեղ կարող եք տեսնել արդյունքները: Ի դեպ, փաթեթը կարող է պահպանվել դրա հետ հետագա աշխատանքի համար:

9) Ինչպես տեսնում եք, արդյունքները աշխատանքը շատ տպավորիչ է: Ծրագիրը հեշտությամբ ճանաչեց նկարը, և դրա տակ տեքստը հեշտությամբ ճանաչվեց: Չնայած այն հանգամանքին, որ ծրագիրը անվճար է, այն հիմնականում հիանալի է:

4. Եզրակացություններ

Եթե ​​դուք հաճախ չեք փաստաթղթեր սկանավորում և ճանաչում, ապա FineReader ծրագիրը գնելը, հավանաբար, իմաստ չունի: Առաջադրանքների մեծ մասը հեշտությամբ վարվում է CuneiForm- ի կողմից:

Մյուս կողմից, նա նույնպես ունի թերություններ:

Նախ ՝ արդյունքը խմբագրելու և ստուգելու համար չափազանց քիչ գործիքներ կան: Երկրորդ, երբ դուք պետք է ճանաչեք շատ նկարներ, FineReader- ում ավելի հարմար է անմիջապես դիտել նախագծում ավելացված ամեն ինչ աջ սյունակում. Արագ հեռացնել ավելորդները, կատարել շտկումներ և այլն: Եվ երրորդ, CuneiForm- ը կորցնում է որպես փաստաթղթերի ճանաչում: Ես պետք է որ փաստաթուղթը մտցնեմ `սխալները խմբագրեմ, կետադրական նշաններ դնեն, չակերտներ և այլն:

Դա բոլորն են: Գիտե՞ք որևէ այլ արժանի անվճար տեքստի ճանաչման ծրագիր:

Pin
Send
Share
Send