Կարո՞ղ է արհեստական ​​բանականությունը կարդալ շեղագիր տառերով տառերը։

Կարո՞ղ է արհեստական ​​բանականությունը կարդալ շեղագիր տառերով տառերը։

Այսպիսով, կարո՞ղ է արհեստական ​​բանականությունը կարդալ շեղագիր տառերով ։

Այո՛։ Արհեստական ​​բանականությունը կարող է կարդալ շեղագիր տառեր ՝ երբեմն շատ լավ, բայց այն միշտ չէ, որ կատարյալ է։ Արդյունքները կարող են շատ տատանվել՝ կախված ձեռագրի ոճից, սկանավորման որակից, լեզվից և այն բանից, թե արդյոք համակարգը իրականում նախատեսված է ձեռագրի համար (ոչ միայն տպագիր տեքստի):

Հոդվածներ, որոնք կարող են ձեզ դուր գալ կարդալ սրանից հետո.

🔗 Որքան ճշգրիտ է արհեստական ​​բանականությունը իրական օգտագործման մեջ
Բացահայտում է, թե ինչն է ազդում արհեստական ​​բանականության ճշգրտության վրա տարբեր առաջադրանքների դեպքում։.

🔗 Ինչպես սովորել արհեստական ​​բանականությունը քայլ առ քայլ
Սկսնակների համար հարմար ուղեցույց՝ արհեստական ​​բանականություն սովորելը վստահորեն սկսելու համար։.

🔗 Որքա՞ն ջուր է օգտագործում արհեստական ​​բանականությունը
Բացատրում է, թե որտեղից է գալիս արհեստական ​​բանականության ջրի օգտագործումը և ինչու։.

🔗 Ինչպես է արհեստական ​​բանականությունը կանխատեսում միտումներն ու օրինաչափությունները
Ցույց է տալիս, թե ինչպես են մոդելները կանխատեսում պահանջարկը, վարքագիծը և շուկայի տատանումները։.


Կարո՞ղ է արհեստական ​​բանականությունը հուսալիորեն կարդալ շեղագիր տառերը։ 🤔

Կարո՞ղ է արհեստական ​​բանականությունը կարդալ շեղագիր տառերով։ Այո՝ ժամանակակից OCR/ձեռագրի ճանաչումը կարող է շեղագիր տեքստը հանել պատկերներից և սկանավորումներից, հատկապես, երբ գրվածքը հետևողական է, և պատկերը՝ պարզ։ Օրինակ՝ հիմնական OCR հարթակները հստակորեն աջակցում են ձեռագրի հանմանը որպես իրենց առաջարկի մաս։ [1][2][3]

Բայց «հուսալիորեն» կախված է նրանից, թե ինչ նկատի ունեք

  • Եթե ​​նկատի ունեք «բավականաչափ լավ՝ էությունը հասկանալու համար» , հաճախ՝ այո ✅

  • Եթե ​​նկատի ունեք «բավականաչափ ճշգրիտ՝ առանց ստուգելու իրավաբանական անունների, հասցեների կամ բժշկական գրառումների համար» , ապա ոչ, անվտանգ չէ 🚩

  • Եթե ​​նկատի ունեք «ցանկացած խզբզոցը անմիջապես վերածել կատարյալ տեքստի», եկեք իրատես լինենք… ոչ 😬

Արհեստական ​​բանականությունն ամենաշատն է դժվարանում, երբ՝

  • Տառերը խառնվում են իրար (դասական շեղագիր խնդիր)

  • Մելանը թույլ է, թուղթը հյուսվածքային է կամ կա արյունահոսություն

  • Ձեռագիրը խիստ անձնական է (տարօրինակ ցիկլեր, անհամապատասխան թեքություններ)

  • Տեքստը պատմական/ոճավորված է կամ օգտագործում է անսովոր տառատեսակներ/ուղղագրություն։

  • Լուսանկարը թեքված է, մշուշոտ, ստվերոտ (հեռախոսով արված լուսանկարներ լամպի տակ… մենք բոլորս էլ դա արել ենք)

Այսպիսով, ավելի լավ շրջանակումը հետևյալն է. արհեստական ​​բանականությունը կարող է կարդալ շեղագիր տառերով, բայց դրա համար անհրաժեշտ են ճիշտ կարգավորումներ և ճիշտ գործիք ։ [1][2][3]

 

Արհեստական ​​​​բանականության կուրս

Ինչո՞ւ է շեղագիր տառատեսակը ավելի դժվար, քան «սովորական» OCR-ը 😵💫

Տպագիր OCR-ը նման է Լեգո աղյուսիկներ կարդալուն՝ առանձին ձևեր, կոկիկ եզրեր:
Շեղագիր տառատեսակը նման է սպագետիի՝ միացված գծեր, անհամապատասխան հեռավորություններ և պատահական… գեղարվեստական ​​որոշումներ 🍝

Հիմնական ցավոտ կետերը

  • Սեգմենտացիա. տառերը միանում են, ուստի «որտե՞ղ է ավարտվում մեկ տառը» հարցը դառնում է ամբողջական խնդիր։

  • Տարբերակ. երկու մարդ «նույն» նամակը գրում են բոլորովին տարբեր ձևերով

  • Համատեքստային կախվածություն. անկանոն տառը վերծանելու համար հաճախ անհրաժեշտ է բառի մակարդակի գուշակություն

  • Շումի զգայունություն. փոքր մշուշը կարող է ջնջել տառերը սահմանող բարակ գծերը

Ահա թե ինչու ձեռագրով գրելու ունակ OCR արտադրանքները հակված են հենվել մեքենայական ուսուցման / խորը ուսուցման մոդելների , այլ ոչ թե հին դպրոցի «գտնել յուրաքանչյուր առանձին նիշ» տրամաբանության վրա: [2][5]


Ի՞նչն է դարձնում «արհեստական ​​​​բանականության շեղագիր ընթերցողը» լավը ✅

Եթե ​​լուծում եք ընտրում, իսկապես լավ ձեռագիրը/շեղագիր կարգավորումը սովորաբար ունի

  • Ձեռագրի աջակցությունը ներդրված է (ոչ միայն «տպագիր տեքստ») [1][2][3]

  • Դասավորության իրազեկություն (որպեսզի կարողանա աշխատել փաստաթղթերի հետ, այլ ոչ թե միայն մեկ տեքստային տողի հետ) [2][3]

  • Վստահության միավորներ + սահմանային վանդակներ (որպեսզի կարողանաք արագ վերանայել կասկածելի հատվածները) [2][3]

  • Լեզվի մշակում (խառը գրելու ոճերը և բազմալեզու տեքստը մի բան են) [2]

  • Մարդու հետ կապի հնարավորություններ կարևոր ցանկացած հարցի համար (բժշկական, իրավաբանական, ֆինանսական):

Նաև՝ ձանձրալի, բայց իրական՝ այն պետք է մշակի ձեր մուտքագրումները՝ լուսանկարներ, PDF ֆայլեր, բազմաէջ սկանավորումներ և «ես սա նկարել եմ մեքենայի մեջ անկյան տակ» պատկերներ 😵: [2][3]


Համեմատական ​​աղյուսակ. գործիքներ, որոնք մարդիկ օգտագործում են «Կարո՞ղ է արհեստական ​​բանականությունը կարդալ ձեռագիր տառերով» հարցնելիս 🧰

Այստեղ գնային խոստումներ չկան (քանի որ գները սիրում են փոխվել): Սա հնարավորությունների տրամադրություն , այլ ոչ թե վճարման զամբյուղ:

Գործիք / Հարթակ Լավագույնը Ինչու է այն աշխատում (և որտեղ՝ ոչ)
Google Cloud Vision (ձեռագիր OCR) [1] Արագ արդյունահանում պատկերներից/սկանավորումներից պատկերներում ձեռագիրը հայտնաբերելու համար
Microsoft Azure-ի ընթերցման OCR (Azure Vision / Փաստաթղթերի հետախուզություն) [2] Խառը տպագիր + ձեռագիր փաստաթղթեր Ակնհայտորեն աջակցում է տպագիր + ձեռագիր տեքստի արդյունահանմանը և տրամադրում է տեղորոշման + վստահության արժեք տեղում տեղադրված կոնտեյներների միջոցով ՝ տվյալների ավելի խիստ վերահսկողության համար։ [2]
Amazon Textract [3] Ձևաթղթեր/կառուցվածքային փաստաթղթեր + ձեռագիր + «ստորագրված է» ստուգումներ Արտահանում է տեքստ/ձեռագիր/տվյալներ և ներառում է ստորագրությունների գործառույթ, որը հայտնաբերում է ստորագրությունները/սկզբնատառերը և վերադարձնում է գտնվելու վայրը + վստահությունը ։ Հիանալի է, երբ ձեզ անհրաժեշտ է կառուցվածք. դեռևս անհրաժեշտ է վերանայել անկանոն պարբերությունները։ [3]
Տրանսկրիբուս [4] Պատմական փաստաթղթեր + նույն ձեռքից գրված բազմաթիվ էջեր Հզոր է, երբ կարող եք օգտագործել հանրային մոդելներ կամ մարզել հատուկ մոդելներ ՝ որոշակի ձեռագրի ոճի համար. «նույն հեղինակը, շատ էջեր» սցենարն է, որտեղ այն իսկապես կարող է փայլել: [4]
Կրակեն (OCR/HTR) [5] Հետազոտություն + պատմական սցենարներ + անհատական ​​ուսուցում Բաց, մարզվող OCR/HTR, որը հատկապես հարմար է կապակցված սկրիպտների , քանի որ կարող է սովորել չբաժնված տողային տվյալներից (այնպես որ դուք ստիպված չեք լինի սկզբում շեղագիր տառերը կտրատել կատարյալ փոքրիկ տառերի): Կարգավորումն ավելի գործնական է: [5]

Խորը ուսումնասիրություն. ինչպես է արհեստական ​​բանականությունը կարդում շեղագիր տառերը ներսից 🧠

Շեղագիր ընթերցման հաջողված համակարգերի մեծ մասն ավելի շատ աշխատում է որպես տառադարձում, քան «յուրաքանչյուր տառը նկատելու»։ Ահա թե ինչու ժամանակակից OCR փաստաթղթերը խոսում են մեքենայական ուսուցման մոդելների և ձեռագրի արդյունահանման մասին, այլ ոչ թե պարզ նիշերի ձևանմուշների մասին։ [2][5]

Պարզեցված խողովակաշար

  1. Նախնական մշակում (շտկում, աղմուկի նվազեցում, կոնտրաստի բարելավում)

  2. Հայտնաբերել տեքստի հատվածները (որտեղ գրություն գոյություն ունի)

  3. Գծային սեգմենտացիա (ձեռագրի տողերի առանձնացում)

  4. Հաջորդականության ճանաչում (տեքստի կանխատեսում տողի երկայնքով)

  5. Արդյունք + վստահություն (որպեսզի մարդիկ կարողանան վերանայել անորոշ մասերը) [2][3]

«Գծի վրայով հաջորդականության» գաղափարը մեծ պատճառ է, թե ինչու ձեռագրի մոդելները կարող են հաղթահարել շեղագիր տառատեսակը. դրանք ստիպված չեն կատարելապես «կռահել յուրաքանչյուր տառի սահմանը» [5]:


Ինչ որակ կարող եք իրատեսորեն ակնկալել (կախված օգտագործման դեպքից) 🎯

Սա այն մասն է, որը մարդիկ բաց են թողնում, իսկ հետո բարկանում։ Այսպիսով… ահա այն։.

Լավ հավանականություններ 👍

  • Մաքուր շեղագիր տողավոր թղթի վրա

  • Մեկ գրող, հետևողական ոճ

  • Բարձր թույլտվությամբ սկանավորում՝ լավ կոնտրաստով

  • Կարճ նշումներ՝ ընդհանուր բառապաշարով

Խառը հավանականություններ 😬

  • Դասարանային նշումներ (խզբզոցներ + նետեր + լուսանցքային քաոս)

  • Լուսապատճենների լուսապատճեններ (և երրորդ սերնդի անիծյալ մշուշոտ պատկերը)

  • Գունաթափված թանաքով օրագրեր

  • Մի քանի գրողներ նույն էջում

  • Նշումներ հապավումներով, մականուններով, ներքին կատակներով

Ռիսկային է՝ մի՛ վստահեք առանց վերանայման 🚩

  • Բժշկական տեղեկանքներ, իրավական երդումներ, ֆինանսական պարտավորություններ

  • Ամեն ինչ, որը պարունակում է անուններ, հասցեներ, անձնագրային համարներ, հաշվի համարներ

  • Պատմական ձեռագրեր՝ անսովոր ուղղագրությամբ կամ տառաձևերով

Եթե ​​դա նշանակություն ունի, արհեստական ​​բանականության արդյունքին վերաբերվեք որպես նախագծի, այլ ոչ թե վերջնական ճշմարտության։.

Աշխատանքային հոսքի օրինակ, որը սովորաբար գործում է.
ձեռագիր ընդունման ձևերի թվայնացման թիմը կատարում է OCR, այնուհետև միայն ձեռքով է ստուգում ցածր վստահության դաշտերը (անուններ, ամսաթվեր, ID համարներ): Սա է «արհեստական ​​բանականությունը ենթադրում է, մարդը հաստատում է» օրինաչափությունը, և դա այն է, թե ինչպես եք պահպանում արագությունն ու բանականությունը: [2][3]


Ավելի լավ արդյունքներ ստանալ (արհեստական ​​բանականությունը պակաս շփոթեցնող դարձնել) 🛠️

Նկարահանման խորհուրդներ (հեռախոսով կամ սկաներով)

  • Օգտագործեք հավասարաչափ լուսավորություն (խուսափեք ստվերներից էջի վրա)

  • Պահեք տեսախցիկը թղթին զուգահեռ

  • Ընտրեք ավելի բարձր լուծաչափ , քան կարծում եք, որ ձեզ անհրաժեշտ է

  • Խուսափեք ագրեսիվ «գեղեցկության ֆիլտրերից». դրանք կարող են ջնջել բարակ գծերը

Մաքրման խորհուրդներ (ճանաչումից առաջ)

  • Կտրել տեքստի հատվածին համապատասխան (ցտեսություն՝ սեղանի եզրեր, ձեռքեր, սուրճի բաժակներ ☕)

  • Մի փոքր բարձրացրեք կոնտրաստը (բայց թղթի հյուսվածքը մի՛ վերածեք ձնաբքի):

  • Ուղղեք էջը (ուղղեք անկյունը)

  • Եթե ​​գծերը համընկնում են կամ եզրերը խառնաշփոթ են, բաժանեք առանձին պատկերների

Աշխատանքային հոսքի խորհուրդներ (մի փոքր հզոր)

  • Օգտագործեք ձեռագիր OCR (հնչում է ակնհայտ… մարդիկ դեռ բաց են թողնում այն) [1][2][3]

  • Վստահության գնահատականներ . նախ վերանայեք ցածր վստահության կետերը [2][3]

  • Եթե ​​նույն հեղինակից շատ էջեր ունեք, մտածեք անհատական ​​​​ուսուցման մասին (այդտեղ է տեղի ունենում «մեհ» → ​​«վա՜յ» ցատկը) [4][5]


«Կարո՞ղ է արհեստական ​​բանականությունը կարդալ ձեռագիր տառերով» ստորագրություններ և փոքրիկ գծագրեր 🖊️

Ստորագրություններն իրենք իրենց գազանն են։.

Ստորագրությունը հաճախ ավելի շատ նշանի , քան ընթեռնելի տեքստի, ուստի շատ փաստաթղթային համակարգեր այն դիտարկում են որպես հայտնաբերելի (և տեղորոշվող) բան, այլ ոչ թե «անվան տառադարձման»։ Օրինակ, Amazon Textract-ի «Ստորագրություններ գործառույթը կենտրոնանում է ստորագրությունների/սկզբնատառերի հայտնաբերման և գտնվելու վայրը + վստահությունը վերադարձնելու վրա, այլ ոչ թե «մուտքագրված անունը գուշակելու» վրա։ [3]

Այսպիսով, եթե ձեր նպատակը «անձի անունը ստորագրությունից հանելն է», ակնկալեք հիասթափություն, եթե ստորագրությունը հիմնականում ընթեռնելի ձեռագիր չէ։.


Գաղտնիություն և անվտանգություն. ձեռագիր նշումներ վերբեռնելը միշտ չէ, որ հանգիստ է 🔒

Եթե ​​մշակում եք բժշկական գրառումներ, ուսանողների տեղեկություններ, հաճախորդների ձևաթղթեր կամ անձնական նամակներ, զգույշ եղեք, թե որտեղ են այդ պատկերները տեղափոխվում։.

Ավելի անվտանգ նախշեր

  • Սկզբում խմբագրեք նույնականացուցիչները (անուններ, հասցեներ, հաշվի համարներ)

  • Հնարավորության դեպքում զգայուն աշխատանքային բեռների համար նախընտրեք տեղական/տեղական

  • Պահպանեք մարդկային վերանայման ցիկլը կարևոր դաշտերի համար

Բոնուս. որոշ փաստաթղթերի աշխատանքային հոսքեր օգտագործում են նաև տեղանքի տեղեկատվություն (սահմանային վանդակներ)՝ խմբագրման խողովակաշարերը աջակցելու համար: [3]


Վերջնական մեկնաբանություններ 🧾✨

Կարո՞ղ է արհեստական ​​բանականությունը կարդալ շեղագիր տառերով։ Այո, և դա զարմանալիորեն լավ է, երբ՝

  • պատկերը մաքուր է

  • ձեռագիրը ներդաշնակ է

  • գործիքը իսկապես նախատեսված է ձեռագրի ճանաչման համար [1][2][3]

Բայց շեղագիր տառատեսակը բնույթով խառնաշփոթ է, ուստի ազնիվ կանոնն է՝ օգտագործեք արհեստական ​​բանականությունը՝ տառադարձումն արագացնելու համար, ապա վերանայեք արդյունքը ։


Հղումներ

[1] Google Cloud OCR-ի օգտագործման դեպքի ակնարկ, ներառյալ Cloud Vision-ի միջոցով ձեռագրի հայտնաբերման աջակցությունը։ կարդալ ավելին
[2] Microsoft-ի OCR (Կարդալ) ակնարկը, որը ներառում է տպագիր + ձեռագրի արդյունահանումը, վստահության գնահատականները և կոնտեյներների տեղակայման տարբերակները։ ավելին
[3] AWS գրառումը, որը բացատրում է Textract-ի ստորագրությունների գործառույթը՝ ստորագրությունների/սկզբնատառերի հայտնաբերման համար՝ տեղորոշմամբ + վստահության արտածմամբ։ կարդալ ավելին
[4] Transkribus-ի ուղեցույց այն մասին, թե ինչու (և երբ) մարզել տեքստի ճանաչման մոդել որոշակի ձեռագրի ոճերի համար։ կարդալ ավելին
[5] Kraken-ի փաստաթղթերը OCR/HTR մոդելների մարզման վերաբերյալ՝ օգտագործելով չբաժնեծված գծային տվյալներ միացված սկրիպտների համար։ կարդալ ավելին

Գտեք արհեստական ​​բանականության վերջին նորույթները պաշտոնական արհեստական ​​բանականության օգնականների խանութում

Մեր մասին

Վերադառնալ բլոգ