Կարո՞ղ է արհեստական ​​բանականությունը կարդալ շեղագիր տառերով տառերը։

Կարո՞ղ է արհեստական ​​բանականությունը կարդալ շեղագիր տառերով տառերը։

Կարճ պատասխան՝ Այո՝ արհեստական ​​բանականությունը կարող է կարդալ շեղագիր տառերով, սակայն հուսալիությունը մեծապես տատանվում է։ Այն հակված է լավ աշխատել, երբ ձեռագիրը համապատասխան է, և սկանավորումը կամ լուսանկարը հստակ են. եթե գրվածքը դժվարընթեռնելի է, թույլ, խիստ ոճավորված կամ տեքստը բարձր ռիսկայնություն ունի (անուններ, հասցեներ, բժշկական/իրավական նշումներ), նախապես մշակեք սխալները և հույսը դրեք մարդկային ստուգման վրա։

Հիմնական եզրակացություններ՝

Հուսալիություն. ակնկալեք «հիմնային մակարդակի» ճշգրտություն, երբ գրելը կոկիկ է, իսկ պատկերները՝ պարզ։

Գործիքավորում. շեղագիր էջերի համար օգտագործեք ձեռագիր OCR, այլ ոչ թե տպագիր տեքստի OCR:

Հաստատում. նախ վերանայեք ցածր վստահության արդյունքներ, հատկապես կարևոր դաշտերի և ID-ների համար։

Որակի վերահսկողություն. բարելավեք նկարահանումը (լուսավորություն, անկյուն, լուծաչափ)՝ ճանաչման սխալները նվազեցնելու համար։

Գաղտնիություն. անձնական փաստաթղթեր մշակելիս խմբագրեք զգայուն տվյալները կամ օգտագործեք տեղում տեղադրված տարբերակները:

Հոդվածներ, որոնք կարող են ձեզ դուր գալ կարդալ սրանից հետո

🔗 Որքան ճշգրիտ է արհեստական ​​բանականությունը իրական օգտագործման մեջ
Բացահայտում է, թե ինչն է ազդում արհեստական ​​բանականության ճշգրտության վրա տարբեր առաջադրանքների դեպքում։.

🔗 Ինչպես սովորել արհեստական ​​բանականությունը քայլ առ քայլ
Սկսնակների համար հարմար ուղեցույց՝ արհեստական ​​բանականություն սովորելը վստահորեն սկսելու համար։.

🔗 Որքա՞ն ջուր է օգտագործում արհեստական ​​բանականությունը
Բացատրում է, թե որտեղից է գալիս արհեստական ​​բանականության ջրի օգտագործումը և ինչու։.

🔗 Ինչպես է արհեստական ​​բանականությունը կանխատեսում միտումներն ու օրինաչափությունները
Ցույց է տալիս, թե ինչպես են մոդելները կանխատեսում պահանջարկը, վարքագիծը և շուկայի տատանումները։.


Կարո՞ղ է արհեստական ​​բանականությունը հուսալիորեն կարդալ շեղագիր տառերը։ 🤔

Կարո՞ղ է արհեստական ​​բանականությունը կարդալ շեղագիր տառերով։ Այո՝ ժամանակակից OCR/ձեռագրի ճանաչումը կարող է շեղագիր տեքստը հանել պատկերներից և սկանավորումներից, հատկապես, երբ գրվածքը հետևողական է, և պատկերը՝ պարզ։ Օրինակ՝ հիմնական OCR հարթակները հստակորեն աջակցում են ձեռագրի հանմանը որպես իրենց առաջարկի մաս։ [1][2][3]

Բայց «հուսալիորեն» կախված է նրանից, թե ինչ նկատի ունեք

  • Եթե ​​նկատի ունեք «բավականաչափ լավ՝ էությունը հասկանալու համար» , հաճախ՝ այո ✅

  • Եթե ​​նկատի ունեք «բավականաչափ ճշգրիտ՝ առանց ստուգելու իրավաբանական անունների, հասցեների կամ բժշկական գրառումների համար» , ապա ոչ, անվտանգ չէ 🚩

  • Եթե ​​նկատի ունեք «ցանկացած խզբզոցը անմիջապես վերածել կատարյալ տեքստի», եկեք իրատես լինենք… ոչ 😬

Արհեստական ​​բանականությունն ամենաշատն է դժվարանում, երբ՝

  • Տառերը խառնվում են իրար (դասական շեղագիր խնդիր)

  • Մելանը թույլ է, թուղթը հյուսվածքային է կամ կա արյունահոսություն

  • Ձեռագիրը խիստ անձնական է (տարօրինակ ցիկլեր, անհամապատասխան թեքություններ)

  • Տեքստը պատմական/ոճավորված է կամ օգտագործում է անսովոր տառատեսակներ/ուղղագրություն։

  • Լուսանկարը թեքված է, մշուշոտ, ստվերոտ (հեռախոսով արված լուսանկարներ լամպի տակ… մենք բոլորս էլ դա արել ենք)

Այսպիսով, ավելի լավ շրջանակումը հետևյալն է. արհեստական ​​բանականությունը կարող է կարդալ շեղագիր տառերով, բայց դրա համար անհրաժեշտ են ճիշտ կարգավորումներ և ճիշտ գործիք։ [1][2][3]

 

Արհեստական ​​​​բանականության կուրս

Ինչո՞ւ է շեղագիր տառատեսակը ավելի դժվար, քան «սովորական» OCR-ը 😵💫

Տպագիր OCR-ը նման է Լեգո աղյուսիկներ կարդալուն՝ առանձին ձևեր, կոկիկ եզրեր:
Շեղագիր տառատեսակը նման է սպագետիի՝ միացված գծեր, անհամապատասխան հեռավորություններ և պատահական… գեղարվեստական ​​որոշումներ 🍝

Հիմնական ցավոտ կետերը

  • Սեգմենտացիա. տառերը միանում են, ուստի «որտե՞ղ է ավարտվում մեկ տառը» հարցը դառնում է ամբողջական խնդիր։

  • Տարբերակ. երկու մարդ «նույն» նամակը գրում են բոլորովին տարբեր ձևերով

  • Համատեքստային կախվածություն. անկանոն տառը վերծանելու համար հաճախ անհրաժեշտ է բառի մակարդակի գուշակություն

  • Շումի զգայունություն. փոքր մշուշը կարող է ջնջել տառերը սահմանող բարակ գծերը

Ահա թե ինչու ձեռագրով գրելու ունակ OCR արտադրանքները հակված են հենվել մեքենայական ուսուցման / խորը ուսուցման մոդելների , այլ ոչ թե հին դպրոցի «գտնել յուրաքանչյուր առանձին նիշ» տրամաբանության վրա: [2][5]


Ի՞նչն է դարձնում «արհեստական ​​​​բանականության շեղագիր ընթերցողը» լավը ✅

Եթե ​​լուծում եք ընտրում, իսկապես լավ ձեռագիրը/շեղագիր կարգավորումը սովորաբար ունի

  • Ձեռագրի աջակցությունը ներդրված է (ոչ միայն «տպագիր տեքստ») [1][2][3]

  • Դասավորության իրազեկություն (որպեսզի կարողանա աշխատել փաստաթղթերի հետ, այլ ոչ թե միայն մեկ տեքստային տողի հետ) [2][3]

  • Վստահության միավորներ + սահմանային վանդակներ (որպեսզի կարողանաք արագ վերանայել կասկածելի հատվածները) [2][3]

  • Լեզվի մշակում (խառը գրելու ոճերը և բազմալեզու տեքստը մի բան են) [2]

  • Մարդու հետ կապի հնարավորություններ կարևոր ցանկացած հարցի համար (բժշկական, իրավաբանական, ֆինանսական):

Նաև՝ ձանձրալի, բայց իրական՝ այն պետք է մշակի ձեր մուտքագրումները՝ լուսանկարներ, PDF ֆայլեր, բազմաէջ սկանավորումներ և «ես սա նկարել եմ մեքենայի մեջ անկյան տակ» պատկերներ 😵: [2][3]


Համեմատական ​​աղյուսակ. գործիքներ, որոնք մարդիկ օգտագործում են «Կարո՞ղ է արհեստական ​​բանականությունը կարդալ ձեռագիր տառերով» հարցնելիս 🧰

Այստեղ գնային խոստումներ չկան (քանի որ գները սիրում են փոխվել): Սա հնարավորությունների տրամադրություն, այլ ոչ թե վճարման զամբյուղ:

Գործիք / Հարթակ Լավագույնը Ինչու է այն աշխատում (և որտեղ՝ ոչ)
Google Cloud Vision (ձեռագիր OCR) [1] Արագ արդյունահանում պատկերներից/սկանավորումներից Նախատեսված է պատկերներում տեքստը և ձեռագիրը հայտնաբերելու համար . հիանալի բազային տեսք, երբ պատկերը մաքուր է, պակաս հաճելի, երբ ձեռագիրը քաոսային է դառնում։ [1]
Microsoft Azure-ի ընթերցման OCR (Azure Vision / Փաստաթղթերի հետախուզություն) [2] Խառը տպագիր + ձեռագիր փաստաթղթեր Ակնհայտորեն աջակցում է տպագիր + ձեռագիր տեքստի արդյունահանմանը և տրամադրում է տեղորոշման + վստահության արժեք ։ Կարող է նաև աշխատել տեղում տեղադրված կոնտեյներների միջոցով ՝ տվյալների ավելի խիստ վերահսկողության համար։ [2]
Amazon Textract [3] Ձևաթղթեր/կառուցվածքային փաստաթղթեր + ձեռագիր + «ստորագրված է» ստուգումներ Արտահանում է տեքստ/ձեռագիր/տվյալներ և ներառում է ստորագրությունների գործառույթ, որը հայտնաբերում է ստորագրությունները/սկզբնատառերը և վերադարձնում է գտնվելու վայրը + վստահությունը։ Հիանալի է, երբ ձեզ անհրաժեշտ է կառուցվածք. դեռևս անհրաժեշտ է վերանայել անկանոն պարբերությունները։ [3]
Տրանսկրիբուս [4] Պատմական փաստաթղթեր + նույն ձեռքից գրված բազմաթիվ էջեր Հզոր է, երբ կարող եք օգտագործել հանրային մոդելներ կամ մարզել հատուկ մոդելներ ՝ որոշակի ձեռագրի ոճի համար. «նույն հեղինակը, շատ էջեր» սցենարն է, որտեղ այն իսկապես կարող է փայլել: [4]
Կրակեն (OCR/HTR) [5] Հետազոտություն + պատմական սցենարներ + անհատական ​​ուսուցում Բաց, մարզվող OCR/HTR, որը հատկապես հարմար է կապակցված սկրիպտների , քանի որ կարող է սովորել չբաժնված տողային տվյալներից (այնպես որ դուք ստիպված չեք լինի սկզբում շեղագիր տառերը կտրատել կատարյալ փոքրիկ տառերի): Կարգավորումն ավելի գործնական է: [5]

Խորը ուսումնասիրություն. ինչպես է արհեստական ​​բանականությունը կարդում շեղագիր տառերը ներսից 🧠

Շեղագիր ընթերցման հաջողված համակարգերի մեծ մասն ավելի շատ աշխատում է որպես տառադարձում, քան «յուրաքանչյուր տառը նկատելու»։ Ահա թե ինչու ժամանակակից OCR փաստաթղթերը խոսում են մեքենայական ուսուցման մոդելների և ձեռագրի արդյունահանման մասին, այլ ոչ թե պարզ նիշերի ձևանմուշների մասին։ [2][5]

Պարզեցված խողովակաշար

  1. Նախնական մշակում (շտկում, աղմուկի նվազեցում, կոնտրաստի բարելավում)

  2. Հայտնաբերել տեքստի հատվածները (որտեղ գրություն գոյություն ունի)

  3. Գծային սեգմենտացիա (ձեռագրի տողերի առանձնացում)

  4. Հաջորդականության ճանաչում (տեքստի կանխատեսում տողի երկայնքով)

  5. Արդյունք + վստահություն (որպեսզի մարդիկ կարողանան վերանայել անորոշ մասերը) [2][3]

«Գծի վրայով հաջորդականության» գաղափարը մեծ պատճառ է, թե ինչու ձեռագրի մոդելները կարող են հաղթահարել շեղագիր տառատեսակը. դրանք ստիպված չեն կատարելապես «կռահել յուրաքանչյուր տառի սահմանը» [5]:


Ինչ որակ կարող եք իրատեսորեն ակնկալել (կախված օգտագործման դեպքից) 🎯

Սա այն մասն է, որը մարդիկ բաց են թողնում, իսկ հետո բարկանում։ Այսպիսով… ահա այն։.

Լավ հավանականություններ 👍

  • Մաքուր շեղագիր տողավոր թղթի վրա

  • Մեկ գրող, հետևողական ոճ

  • Բարձր թույլտվությամբ սկանավորում՝ լավ կոնտրաստով

  • Կարճ նշումներ՝ ընդհանուր բառապաշարով

Խառը հավանականություններ 😬

  • Դասարանային նշումներ (խզբզոցներ + նետեր + լուսանցքային քաոս)

  • Լուսապատճենների լուսապատճեններ (և երրորդ սերնդի անիծյալ մշուշոտ պատկերը)

  • Գունաթափված թանաքով օրագրեր

  • Մի քանի գրողներ նույն էջում

  • Նշումներ հապավումներով, մականուններով, ներքին կատակներով

Ռիսկային է՝ մի՛ վստահեք առանց վերանայման 🚩

  • Բժշկական տեղեկանքներ, իրավական երդումներ, ֆինանսական պարտավորություններ

  • Ամեն ինչ, որը պարունակում է անուններ, հասցեներ, անձնագրային համարներ, հաշվի համարներ

  • Պատմական ձեռագրեր՝ անսովոր ուղղագրությամբ կամ տառաձևերով

Եթե ​​դա նշանակություն ունի, արհեստական ​​բանականության արդյունքին վերաբերվեք որպես նախագծի, այլ ոչ թե վերջնական ճշմարտության։.

Աշխատանքային հոսքի օրինակ, որը սովորաբար գործում է.
ձեռագիր ընդունման ձևերի թվայնացման թիմը կատարում է OCR, այնուհետև միայն ձեռքով է ստուգում ցածր վստահության դաշտերը (անուններ, ամսաթվեր, ID համարներ): Սա է «արհեստական ​​բանականությունը ենթադրում է, մարդը հաստատում է» օրինաչափությունը, և դա այն է, թե ինչպես եք պահպանում արագությունն ու բանականությունը: [2][3]


Ավելի լավ արդյունքներ ստանալ (արհեստական ​​բանականությունը պակաս շփոթեցնող դարձնել) 🛠️

Նկարահանման խորհուրդներ (հեռախոսով կամ սկաներով)

  • Օգտագործեք հավասարաչափ լուսավորություն (խուսափեք ստվերներից էջի վրա)

  • Պահեք տեսախցիկը թղթին զուգահեռ (խուսափեք սեղանաձև էջերից)

  • Ընտրեք ավելի բարձր լուծաչափ , քան կարծում եք, որ ձեզ անհրաժեշտ է

  • Խուսափեք ագրեսիվ «գեղեցկության ֆիլտրերից». դրանք կարող են ջնջել բարակ գծերը

Մաքրման խորհուրդներ (ճանաչումից առաջ)

  • Կտրել տեքստի հատվածին համապատասխան (ցտեսություն՝ սեղանի եզրեր, ձեռքեր, սուրճի բաժակներ ☕)

  • Մի փոքր բարձրացրեք կոնտրաստը (բայց թղթի հյուսվածքը մի՛ վերածեք ձնաբքի):

  • Ուղղեք էջը (ուղղեք անկյունը)

  • Եթե ​​գծերը համընկնում են կամ եզրերը խառնաշփոթ են, բաժանեք առանձին պատկերների

Աշխատանքային հոսքի խորհուրդներ (մի փոքր հզոր)

  • Օգտագործեք ձեռագիր OCR (հնչում է ակնհայտ… մարդիկ դեռ բաց են թողնում այն) [1][2][3]

  • Վստահության գնահատականներ. նախ վերանայեք ցածր վստահության կետերը [2][3]

  • Եթե ​​նույն հեղինակից շատ էջեր ունեք, մտածեք անհատական ​​​​ուսուցման մասին (այդտեղ է տեղի ունենում «մեհ» → ​​«վա՜յ» ցատկը) [4][5]


«Կարո՞ղ է արհեստական ​​բանականությունը կարդալ ձեռագիր տառերով» ստորագրություններ և փոքրիկ գծագրեր 🖊️

Ստորագրություններն իրենք իրենց գազանն են։.

Ստորագրությունը հաճախ ավելի շատ նշանի , քան ընթեռնելի տեքստի, ուստի շատ փաստաթղթային համակարգեր այն դիտարկում են որպես հայտնաբերելի (և տեղորոշվող) բան, այլ ոչ թե «անվան տառադարձման»։ Օրինակ, Amazon Textract-ի «Ստորագրություններ գործառույթը կենտրոնանում է ստորագրությունների/սկզբնատառերի հայտնաբերման և գտնվելու վայրը + վստահությունը վերադարձնելու վրա, այլ ոչ թե «մուտքագրված անունը գուշակելու» վրա։ [3]

Այսպիսով, եթե ձեր նպատակը «անձի անունը ստորագրությունից հանելն է», ակնկալեք հիասթափություն, եթե ստորագրությունը հիմնականում ընթեռնելի ձեռագիր չէ։.


Գաղտնիություն և անվտանգություն. ձեռագիր նշումներ վերբեռնելը միշտ չէ, որ հանգիստ է 🔒

Եթե ​​մշակում եք բժշկական գրառումներ, ուսանողների տեղեկություններ, հաճախորդների ձևաթղթեր կամ անձնական նամակներ, զգույշ եղեք, թե որտեղ են այդ պատկերները տեղափոխվում։.

Ավելի անվտանգ նախշեր

  • Սկզբում խմբագրեք նույնականացուցիչները (անուններ, հասցեներ, հաշվի համարներ)

  • Հնարավորության դեպքում զգայուն աշխատանքային բեռների համար նախընտրեք տեղական/տեղական տարբերակները (որոշ OCR փաթեթներ աջակցում են կոնտեյներների տեղակայմանը) [2]

  • Պահպանեք մարդկային վերանայման ցիկլը կարևոր դաշտերի համար

Բոնուս. որոշ փաստաթղթերի աշխատանքային հոսքեր օգտագործում են նաև տեղանքի տեղեկատվություն (սահմանային վանդակներ)՝ խմբագրման խողովակաշարերը աջակցելու համար: [3]


Վերջնական մեկնաբանություններ 🧾✨

Կարո՞ղ է արհեստական ​​բանականությունը կարդալ շեղագիր տառերով։ Այո, և դա զարմանալիորեն լավ է, երբ՝

  • պատկերը մաքուր է

  • ձեռագիրը ներդաշնակ է

  • գործիքը իսկապես նախատեսված է ձեռագրի ճանաչման համար [1][2][3]

Բայց շեղագիր տառատեսակը բնույթով խառնաշփոթ է, ուստի ազնիվ կանոնն է՝ օգտագործեք արհեստական ​​բանականությունը՝ տառադարձումն արագացնելու համար, ապա վերանայեք արդյունքը։

Իրական աշխարհի օրինակ՝ ձեռագիր ընդունելության ձևաթղթերի թվայնացում 📝

Սցենար

Պատկերացրեք մի փոքրիկ ֆիզիոթերապիայի կլինիկա՝ 500 հին թղթե ընդունման ձևաթղթերով: Ձևաթղթերի մեծ մասը ներառում է տպագիր տուփերի, շեղագիր նշումների, ամսաթվերի, հեռախոսահամարների, ընտանեկան բժշկի անունների, վնասվածքների նկարագրությունների և ստորագրությունների համադրություն:.

Կլինիկան կարիք չունի կատարյալ «ամեն ինչ ավտոմատ կերպով կարդալու» կախարդանքի։ Այն կարիք ունի ավելի անվտանգ աշխատանքային հոսքի. օգտագործեք արհեստական ​​բանականություն՝ տառադարձությունը կազմելու համար, ապա թող ընդունարանի աշխատակիցը ստուգի այն դաշտերը, որտեղ սխալները կարող են էական լինել։.

Սա լավ է ձեռագրով OCR-ի համար, քանի որ փաստաթղթերն ունեն կրկնվող դասավորություն, բայց այն դեռևս կարիք ունի մարդկային վերանայման, քանի որ անունները, ամսաթվերը, հասցեները և բժշկական նշումները բարձր ռիսկի դաշտեր են։.

Ինչ է անհրաժեշտ աշխատանքային հոսքի համար

  • Յուրաքանչյուր ձևի մաքուր սկանավորում, իդեալականում՝ 300 DPI կամ ավելի բարձր

  • Ձեռագիր գրելու ունակ OCR գործիք

  • Արդյունահանված դաշտերի համար աղյուսակ կամ տվյալների բազա

  • «Պարտադիր ստուգման» ենթակա դաշտերի ցանկ՝ հիվանդի անուն, ազգանուն, ծննդյան ամսաթիվ, հեռախոսահամար, հասցե, դեղորայք, ալերգիաներ, ընտանեկան բժշկի անուն և ստորագրության կարգավիճակ

  • Վերանայող, որը համեմատում է ցածր վստահության դաշտերը սկզբնական սկանավորման հետ

Օրինակային հրահանգ

Արդյունահանումը կարգավորելիս օգտագործեք այս տեսակի հրահանգը

Կարդացեք այս ձեռագիր դիմումի ձևը և լրացրեք հետևյալ դաշտերը՝ անուն, ազգանուն, ծննդյան ամսաթիվ, հեռախոսահամար, հասցե, այցելության պատճառ, վնասվածքի ամսաթիվ, ընթացիկ դեղորայք, ալերգիաներ, ընտանեկան բժշկի անուն, արտակարգ իրավիճակներում կոնտակտային անձ և ստորագրություն, թե ոչ։.

Արդյունքը վերադարձրեք պարզ աղյուսակի տեսքով: Ցանկացած անհասկանալի դաշտ նշեք որպես «Պետք է վերանայել», այլ ոչ թե կռահել: Եթե որևէ բառ մասամբ կարդացվող է, ներառեք ձեր լավագույն ընթերցումը, որին կհաջորդի «անորոշ»: Մի հորինեք բացակայող մանրամասներ:.

Ինչպես փորձարկել այն

Սկսեք փոքր թեստային հավաքածուից՝ յուրաքանչյուր ձևը մշակելուց առաջ։.

Օգտագործեք 30 ձև, որոնք բաժանված են երեք խմբի՝

  • 10 կոկիկ ձև՝ հստակ շեղագիր տառերով

  • 10 միջին ձև՝ խառը տպագրությամբ և շեղագրով

  • 10 դժվարընթեռնելի ձևաթղթեր՝ թույլ թանաքով, խաչված բառերով կամ անսովոր ձեռագրով

Յուրաքանչյուր ձևի համար համեմատեք արհեստական ​​բանականության արդյունքը ձեռքով կատարված տառադարձման հետ։ Հետևեք՝

  • Քանի՞ դաշտ էր ճիշտ

  • Քանի՞սն են նշվել «Վերանայման կարիք ունի» նշումով։

  • Քանի՞ սխալ դաշտ չի նշվել

  • Որքա՞ն ժամանակ է պահանջվել ձեռքով մուտքագրումը OCR-ը օգտագործելուց առաջ և հետո։

Լավ թեստը միայն այն չէ, թե «արդյո՞ք արհեստական ​​բանականությունը կարդացել է էջը»։ Այն նաև այն է, թե «արդյո՞ք աշխատանքային հոսքը նկատել է ռիսկային սխալները տվյալների օգտագործումից առաջ»։

Արդյունք

Օրինակելի արդյունք. 30 ձևաթղթից բաղկացած թեստի ժամանակի հաշվարկի հիման վրա, ձեռքով մուտքագրումը տևել է մոտ 4 րոպե յուրաքանչյուր ձևաթղթի համար, կամ ընդհանուր առմամբ 120 րոպե։.

Ձեռագրի OCR-ի և մարդու կողմից կատարված վերանայման միջոցով կատարվել են հետևյալ աշխատանքները՝

  • 45 վայրկյան OCR մշակման և արտահանման համար մեկ ձևի համար

  • 90 վայրկյան մարդու կողմից յուրաքանչյուր ձևի վերանայման համար

  • Ընդհանուր առմամբ մոտ 67.5 րոպե 30 ձևաթղթի համար

Դա 30 ձևաթղթերի համար մոտավորապես 52.5 րոպե խնայողություն է տալիս, կամ մոտ 1 րոպե 45 վայրկյան՝ յուրաքանչյուր ձևաթղթի համար։.

Ճշգրտությունը պետք է չափվի նաև դաշտի տեսակով։ Այս օրինակային թեստում՝

  • Ընդհանուր նշումների դաշտերը gist-ի համար օգտագործելի էին 30 ձևաթղթերից 26-ում։

  • Անուններն ու ամսաթվերը դեռևս պետք է ձեռքով ստուգվեն բոլոր 30 ձևաթղթերում

  • 7 ձևաթղթերում կար առնվազն մեկ կարևոր դաշտ, որը նշված էր «Վերանայման կարիք ունի» գրառմամբ։

  • 2 ձևաթղթերում կար դեղամիջոցի կամ ալերգիայի մասին բառ, որը արհեստական ​​բանականությունը սխալ էր կարդացել, և միայն մարդ-գրախոսողն էր նկատել։

Այսպիսով, հաղթանակը «մարդկանց կարիք չկա» չէ: Հաղթանակը առաջին անցման ավելի արագ տառադարձումն է՝ միաժամանակ մարդկային դարպասը պահելով ռիսկային տեղեկատվության համար:.

Ի՞նչը կարող է սխալ ընթանալ

Ամենամեծ սխալը մաքուր տեսք ունեցող արդյունքին չափազանց վստահելն է։ Արհեստական ​​բանականությունը կարող է վստահ տեսք ունեցող պատասխան տալ նույնիսկ այն դեպքում, երբ ձեռագիրը երկիմաստ է։.

Այլ տարածված խնդիրներ՝

  • Ձևաթղթերի սկանավորում ցածր լուծաչափով

  • Թույլ տալով, որ ստվերները կամ էջի կորերը աղավաղեն տեքստը

  • Տպագիր տեքստի OCR-ի օգտագործումը ձեռագիր OCR-ի փոխարեն

  • Ստորագրությունները որպես ընթեռնելի անուններ ընդունելը

  • Անունները, ամսաթվերը, դեղորայքը, ալերգիաները և անձնագրերը չստուգելը

  • Գաղտնիության կարգավորումները ստուգելու առանց գործիքի վրա զգայուն ձևերի վերբեռնում

Գործնական ուսուցողական նյութ

Շեղագիր փաստաթղթերի համար լավագույն աշխատանքային հոսքը «արհեստական ​​բանականությունը փոխարինում է տառադարձմանը» չէ: Այլ «արհեստական ​​բանականությունը ստեղծում է առաջին սևագիրը, մարդիկ ստուգում են ռիսկային մասերը»: Դա ձեզ արագություն է տալիս՝ առանց ձևացնելու, թե դժվար ձեռագիրը հանկարծակի անսխալ է դառնում:.


Հաճախակի տրվող հարցեր

Կարո՞ղ է արհեստական ​​բանականությունը ճշգրիտ կարդալ շեղագիր ձեռագիրը։

Արհեստական ​​բանականությունը կարող է կարդալ շեղագիր տառերով, սակայն ճշգրտությունը մեծապես կախված է նրանից, թե որքան կոկիկ և հետևողական է ձեռագիրը, և որքան պարզ է երևում պատկերը կամ սկանավորումը։ Շատ դեպքերում դա բավարար է գրառման էությունը ֆիքսելու համար։ Բարձր ռիսկային ցանկացած հարցի դեպքում, ինչպիսիք են անունները, հասցեները կամ բժշկական/իրավական բովանդակությունը, սպասեք սխալների և պլանավորեք մարդկային ստուգումը։.

Ո՞րն է ձեռագիր տեքստի համար լավագույն OCR տարբերակը՝ սովորական OCR-ը, թե՞ ձեռագիր OCR-ը։

Շեղագիր տառատեսակի համար ձեռագիր OCR-ն ավելի լավ է համապատասխանում, քան տպագիր տեքստի OCR-ը: Տպագիր OCR-ը նախատեսված է մաքուր, առանձնացված նիշերի համար, մինչդեռ շեղագիր տառատեսակը պահանջում է մոդելներ, որոնք կարող են մեկնաբանել կապակցված գծերը և բառային համատեքստը: Շատ հիմնական OCR հարթակներ այժմ ներառում են ձեռագիր տառատեսակի արդյունահանման գործառույթներ, որոնք սովորաբար ճիշտ տեղն են շեղագիր էջերի համար:.

Ինչո՞ւ շեղագիր տառատեսակն ավելի շատ սխալներ է առաջացնում, քան տպագիր տեքստը։

Շեղագիր տառատեսակն ավելի դժվար է գրել, քանի որ տառերը միանում են միմյանց, տարածությունների տատանումները, և անհատական ​​գրելու ոճերը կարող են զգալիորեն տարբերվել։ Դա շատ ավելի քիչ ակնհայտ է դարձնում, թե որտեղ է ավարտվում մեկ տառը և սկսվում մյուսը, քան տպագիր տեքստի դեպքում։ Փոքր խնդիրները, ինչպիսիք են մշուշոտությունը, թույլ թանաքը կամ հյուսվածքային թուղթը, նույնպես կարող են ջնջել իմաստ պարունակող բարակ գծերը, ինչը արագորեն մեծացնում է ճանաչման սխալները։.

Որքանո՞վ է արհեստական ​​բանականությունը հուսալի ձեռագիր անունները, հասցեները և անձնագրային համարները կարդալու համար։

Սա ամենաբարձր ռիսկի կատեգորիան է: Նույնիսկ երբ արհեստական ​​բանականությունը լավ է մշակում շրջապատող տեքստը, կարևորագույն դաշտերը, ինչպիսիք են անունները, հասցեները, հաշվի համարները կամ ID-ները, այն են, որտեղ ճանաչման աննշան սխալները մեծ հետևանքներ են ունենում: Տարածված մոտեցում է արհեստական ​​բանականության արդյունքը որպես սևագիր դիտարկելը. օգտագործեք վստահության միավորներ՝ անորոշ բաժինները նշելու համար, ապա առաջնահերթություն տվեք այդ կարևորագույն դաշտերի ձեռքով վերանայմանը:.

Ո՞րն է լավագույն աշխատանքային հոսքը՝ շեղագիր տառերը մասշտաբային հուսալիորեն կարդալու համար։

Գործնական աշխատանքային հոսքը հետևյալն է. «Արհեստական ​​բանականությունը հուշում է, մարդը հաստատում է»: Գործարկեք ձեռագրի OCR-ը, այնուհետև վերանայեք ցածր վստահության արդյունքները՝ ամեն ինչ ստուգելու փոխարեն: Շատ OCR համակարգեր տրամադրում են վստահության միավորներ և գտնվելու վայրի տվյալներ (օրինակ՝ սահմանազատման վանդակներ), որոնք օգնում են ձեզ արագ գտնել այն մասերը, որոնք, ամենայն հավանականությամբ, սխալ կլինեն: Այս մոտեցումը գործնականում հավասարակշռում է փաստաթղթերի արագությունը ճշգրտության հետ:.

Ինչպե՞ս կարող եմ բարելավել հեռախոսի լուսանկարներից ստացված շեղագիր OCR արդյունքները։

Լուսանկարի որակը շատ կարևոր է: Օգտագործեք հավասարաչափ լուսավորություն՝ ստվերներից խուսափելու համար, պահեք տեսախցիկը էջին զուգահեռ՝ աղավաղումը նվազեցնելու համար, և ընտրեք ավելի բարձր լուծաչափ, քան կարծում եք, որ անհրաժեշտ է: Տեքստի հատվածին համապատասխան կտրելը, կոնտրաստի ուշադիր ուժեղացումը և պատկերի թեքությունը նվազեցնելը կարող են նվազեցնել սխալները: Խուսափեք ծանր «գեղեցկության» ֆիլտրերից, որոնք կարող են վերացնել գրիչի բարակ գծերը:.

Կարո՞ղ է արհեստական ​​բանականությունը կարդալ շեղագիր ստորագրությունները և դրանք վերածել տպագրված անունների։

Ստորագրությունները սովորաբար տարբեր կերպ են մշակվում սովորական ձեռագրից, քանի որ դրանք հաճախ ավելի մոտ են նշանին, քան ընթեռնելի տեքստին: Շատ համակարգեր կենտրոնանում են ստորագրության առկայությունը և տեղը հայտնաբերելու (և վստահություն ապահովելու) վրա, այլ ոչ թե այն անձի մուտքագրված անունով տառադարձելու վրա: Եթե ձեզ անհրաժեշտ է ստորագրողի անունը, սովորաբար կհիմնվեք առանձին տպագիր դաշտի կամ ձեռքով հաստատման վրա:.

Արժե՞ մարզել շեղագիր ձեռագրի համար նախատեսված անհատական ​​մոդել։

Այդպես կարող է լինել, հատկապես, եթե նույն հեղինակի կողմից գրված բազմաթիվ էջեր կամ փաստաթղթերում նույն ձեռագրի ոճը համընկնում է: «Նույն ձեռագիր, շատ էջեր» սցենարներում անհատականացված ուսուցումը կարող է զգալիորեն բարելավել արդյունքները՝ համեմատած ընդհանուր մոդելների հետ: Եթե ձեր մուտքագրումները տարբերվում են տարբեր հեղինակների և ոճերի միջև, շահույթը հաճախ ավելի փոքր է, և դուք դեռ կցանկանաք վերանայման քայլ կատարել:.

Անվտա՞նգ է ձեռագիր նշումներ վերբեռնել OCR ծառայության մեջ։

Դա կախված է բովանդակության զգայունությունից և մշակման վայրից: Եթե դուք զբաղվում եք անձնական փաստաթղթերով, ինչպիսիք են բժշկական գրառումները, ուսանողների տվյալները կամ հաճախորդների ձևաթղթերը, ավելի անվտանգ մոտեցում է նախ խմբագրել նույնականացուցիչները և օգտագործել ավելի խիստ տեղակայման տարբերակներ, երբ դրանք հասանելի են: Կարևոր դաշտերի համար մարդկային վերանայման ցիկլի պահպանումը նաև նվազեցնում է սխալ արդյունահանումների հիման վրա գործողությունների ռիսկը:.

Հղումներ

[1] Google Cloud OCR-ի օգտագործման դեպքի ակնարկ, ներառյալ Cloud Vision-ի միջոցով ձեռագրի հայտնաբերման աջակցությունը։ կարդալ ավելին
[2] Microsoft-ի OCR (Կարդալ) ակնարկը, որը ներառում է տպագիր + ձեռագրի արդյունահանումը, վստահության գնահատականները և կոնտեյներների տեղակայման տարբերակները։ ավելին
[3] AWS գրառումը, որը բացատրում է Textract-ի ստորագրությունների գործառույթը՝ ստորագրությունների/սկզբնատառերի հայտնաբերման համար՝ տեղորոշմամբ + վստահության արտածմամբ։ կարդալ ավելին
[4] Transkribus-ի ուղեցույց այն մասին, թե ինչու (և երբ) մարզել տեքստի ճանաչման մոդել որոշակի ձեռագրի ոճերի համար։ կարդալ ավելին
[5] Kraken-ի փաստաթղթերը OCR/HTR մոդելների մարզման վերաբերյալ՝ օգտագործելով չբաժնեծված տողային տվյալներ միացված սկրիպտների համար։ կարդալ ավելին

Գտեք արհեստական ​​բանականության վերջին նորույթները պաշտոնական արհեստական ​​բանականության օգնականների խանութում

Մեր մասին

Վերադառնալ բլոգ

Լրացուցիչ Հաճախակի տրվող հարցեր

  • Որքանո՞վ է արհեստական ​​բանականությունը ճշգրիտ ձեռագիրը կարդալիս։

    Արհեստական ​​բանականության՝ շեղագիր ձեռագիրը կարդալու կարողությունը տարբեր է։ Այն կարող է արդյունավետորեն արտացոլել կոկիկ և պարզ ձեռագրի էությունը, սակայն բարձր ռիսկային բովանդակության, ինչպիսիք են անունները կամ բժշկական գրառումները, դեպքում խորհուրդ է տրվում արդյունքները ստուգել ձեռքով՝ հնարավոր սխալների պատճառով։.

  • Ո՞ր տեխնոլոգիան է լավագույնը շեղագիր տեքստի ճանաչման համար։

    Շեղագիր ձեռագիրը ճանաչելու համար ավանդական տպագիր տեքստի OCR լուծումների համեմատ խորհուրդ է տրվում ձեռագիր տեքստը ճանաչելու ունակությամբ OCR (օպտիկական նիշերի ճանաչման) համակարգերը, քանի որ դրանք հատուկ նախագծված են շեղագիր գրությանը բնորոշ կապակցված գծերը մշակելու համար։.

  • Ո՞ր գործոններն են նպաստում շեղագիր ձեռագրի ճանաչման ճշգրտությանը։

    Շեղագիր ձեռագրի ճանաչման ճշգրտությունը կախված է այնպիսի գործոններից, ինչպիսիք են պատկերի պարզությունը, ձեռագրի համապատասխանությունը և օգտագործվող OCR գործիքի որակը: Լավ գրված շեղագիր ձեռագրի մաքուր, բարձր թույլտվությամբ սկանավորումները զգալիորեն բարելավում են արդյունքները:.

  • Ինչո՞վ է շեղագիր ձեռագիրը տարբերվում տպագիր տեքստից OCR մարտահրավերների առումով։

    Շեղագիր ձեռագիրը յուրահատուկ մարտահրավերներ է ներկայացնում OCR-ի համար՝ տառերի կապված բնույթի և առանձին գրելու ոճերի փոփոխականության պատճառով։ Սա դժվարացնում է մեկ տառի ավարտի և մյուսի սկսման հեշտությունը, ինչը հաճախ հանգեցնում է սխալների ավելի բարձր մակարդակի։.

  • Արդյո՞ք մարդկային վերանայումն անհրաժեշտ է շեղագիր ձեռագրից ստացված կարևոր տեղեկատվության համար։

    Այո, հատկապես կարևոր տեղեկությունների, ինչպիսիք են անունները, հասցեները և նույնականացման համարները, կարևոր է ձեռքով վերանայել արհեստական ​​բանականության միջոցով ստացված արդյունքները: Միայն արհեստական ​​բանականության արդյունքներին ապավինելը՝ առանց ստուգման, կարող է հանգեցնել էական սխալների:.

  • Որո՞նք են ձեռագիր պատկերներից OCR արդյունքները բարելավելու որոշ խորհուրդներ։

    OCR արդյունքները բարելավելու համար պատկերներ նկարահանելիս ապահովեք հավասարաչափ լուսավորություն, պահպանեք տեսախցիկի անկյունը թղթին զուգահեռ, օգտագործեք բարձր լուծաչափ և կտրեք պատկերները՝ տեքստի վրա կենտրոնանալու համար, միաժամանակ մեծացնելով կոնտրաստը՝ բարակ գծերն ավելի հստակ դարձնելու համար։.

  • Կարո՞ղ է արհեստական ​​բանականությունը ստորագրություններ հանել ձեռագիր փաստաթղթերից, և արդյո՞ք այն հուսալի է։

    Արհեստական ​​բանականությունը կարող է հայտնաբերել և տրամադրել ստորագրությունների մասին տեղեկատվություն, սակայն այն սովորաբար կենտրոնանում է դրանց գտնվելու վայրի և վստահության մակարդակի վրա, այլ ոչ թե դրանք ուղղակիորեն անունների վերածելու վրա: Անունների ճշգրիտ արդյունահանման համար հաճախ անհրաժեշտ է ձեռքով հաստատում:.