Կարճ պատասխան՝ Այո՝ արհեստական բանականությունը կարող է կարդալ շեղագիր տառերով, սակայն հուսալիությունը մեծապես տատանվում է։ Այն հակված է լավ աշխատել, երբ ձեռագիրը համապատասխան է, և սկանավորումը կամ լուսանկարը հստակ են. եթե գրվածքը դժվարընթեռնելի է, թույլ, խիստ ոճավորված կամ տեքստը բարձր ռիսկայնություն ունի (անուններ, հասցեներ, բժշկական/իրավական նշումներ), նախապես մշակեք սխալները և հույսը դրեք մարդկային ստուգման վրա։
Հիմնական եզրակացություններ՝
Հուսալիություն . ակնկալեք «հիմնային մակարդակի» ճշգրտություն, երբ գրելը կոկիկ է, իսկ պատկերները՝ պարզ։
Գործիքավորում . շեղագիր էջերի համար օգտագործեք ձեռագիր OCR, այլ ոչ թե տպագիր տեքստի OCR:
Հաստատում . նախ վերանայեք ցածր վստահության արդյունքներ, հատկապես կարևոր դաշտերի և ID-ների համար։
Որակի վերահսկողություն . բարելավեք նկարահանումը (լուսավորություն, անկյուն, լուծաչափ)՝ ճանաչման սխալները նվազեցնելու համար։
Գաղտնիություն . անձնական փաստաթղթեր մշակելիս խմբագրեք զգայուն տվյալները կամ օգտագործեք տեղում տեղադրված տարբերակները:
Հոդվածներ, որոնք կարող են ձեզ դուր գալ կարդալ սրանից հետո
🔗 Որքան ճշգրիտ է արհեստական բանականությունը իրական օգտագործման մեջ
Բացահայտում է, թե ինչն է ազդում արհեստական բանականության ճշգրտության վրա տարբեր առաջադրանքների դեպքում։.
🔗 Ինչպես սովորել արհեստական բանականությունը քայլ առ քայլ
Սկսնակների համար հարմար ուղեցույց՝ արհեստական բանականություն սովորելը վստահորեն սկսելու համար։.
🔗 Որքա՞ն ջուր է օգտագործում արհեստական բանականությունը
Բացատրում է, թե որտեղից է գալիս արհեստական բանականության ջրի օգտագործումը և ինչու։.
🔗 Ինչպես է արհեստական բանականությունը կանխատեսում միտումներն ու օրինաչափությունները
Ցույց է տալիս, թե ինչպես են մոդելները կանխատեսում պահանջարկը, վարքագիծը և շուկայի տատանումները։.
Կարո՞ղ է արհեստական բանականությունը հուսալիորեն կարդալ շեղագիր տառերը։ 🤔
Կարո՞ղ է արհեստական բանականությունը կարդալ շեղագիր տառերով։ Այո՝ ժամանակակից OCR/ձեռագրի ճանաչումը կարող է շեղագիր տեքստը հանել պատկերներից և սկանավորումներից, հատկապես, երբ գրվածքը հետևողական է, և պատկերը՝ պարզ։ Օրինակ՝ հիմնական OCR հարթակները հստակորեն աջակցում են ձեռագրի հանմանը որպես իրենց առաջարկի մաս։ [1][2][3]
Բայց «հուսալիորեն» կախված է նրանից, թե ինչ նկատի ունեք
-
Եթե նկատի ունեք «բավականաչափ լավ՝ էությունը հասկանալու համար» , հաճախ՝ այո ✅
-
Եթե նկատի ունեք «բավականաչափ ճշգրիտ՝ առանց ստուգելու իրավաբանական անունների, հասցեների կամ բժշկական գրառումների համար» , ապա ոչ, անվտանգ չէ 🚩
-
Եթե նկատի ունեք «ցանկացած խզբզոցը անմիջապես վերածել կատարյալ տեքստի», եկեք իրատես լինենք… ոչ 😬
Արհեստական բանականությունն ամենաշատն է դժվարանում, երբ՝
-
Տառերը խառնվում են իրար (դասական շեղագիր խնդիր)
-
Մելանը թույլ է, թուղթը հյուսվածքային է կամ կա արյունահոսություն
-
Ձեռագիրը խիստ անձնական է (տարօրինակ ցիկլեր, անհամապատասխան թեքություններ)
-
Տեքստը պատմական/ոճավորված է կամ օգտագործում է անսովոր տառատեսակներ/ուղղագրություն։
-
Լուսանկարը թեքված է, մշուշոտ, ստվերոտ (հեռախոսով արված լուսանկարներ լամպի տակ… մենք բոլորս էլ դա արել ենք)
Այսպիսով, ավելի լավ շրջանակումը հետևյալն է. արհեստական բանականությունը կարող է կարդալ շեղագիր տառերով, բայց դրա համար անհրաժեշտ են ճիշտ կարգավորումներ և ճիշտ գործիք ։ [1][2][3]

Ինչո՞ւ է շեղագիր տառատեսակը ավելի դժվար, քան «սովորական» OCR-ը 😵💫
Տպագիր OCR-ը նման է Լեգո աղյուսիկներ կարդալուն՝ առանձին ձևեր, կոկիկ եզրեր:
Շեղագիր տառատեսակը նման է սպագետիի՝ միացված գծեր, անհամապատասխան հեռավորություններ և պատահական… գեղարվեստական որոշումներ 🍝
Հիմնական ցավոտ կետերը
-
Սեգմենտացիա. տառերը միանում են, ուստի «որտե՞ղ է ավարտվում մեկ տառը» հարցը դառնում է ամբողջական խնդիր։
-
Տարբերակ. երկու մարդ «նույն» նամակը գրում են բոլորովին տարբեր ձևերով
-
Համատեքստային կախվածություն. անկանոն տառը վերծանելու համար հաճախ անհրաժեշտ է բառի մակարդակի գուշակություն
-
Շումի զգայունություն. փոքր մշուշը կարող է ջնջել տառերը սահմանող բարակ գծերը
Ահա թե ինչու ձեռագրով գրելու ունակ OCR արտադրանքները հակված են հենվել մեքենայական ուսուցման / խորը ուսուցման մոդելների , այլ ոչ թե հին դպրոցի «գտնել յուրաքանչյուր առանձին նիշ» տրամաբանության վրա: [2][5]
Ի՞նչն է դարձնում «արհեստական բանականության շեղագիր ընթերցողը» լավը ✅
Եթե լուծում եք ընտրում, իսկապես լավ ձեռագիրը/շեղագիր կարգավորումը սովորաբար ունի
-
Ձեռագրի աջակցությունը ներդրված է (ոչ միայն «տպագիր տեքստ») [1][2][3]
-
Դասավորության իրազեկություն (որպեսզի կարողանա աշխատել փաստաթղթերի հետ, այլ ոչ թե միայն մեկ տեքստային տողի հետ) [2][3]
-
Վստահության միավորներ + սահմանային վանդակներ (որպեսզի կարողանաք արագ վերանայել կասկածելի հատվածները) [2][3]
-
Լեզվի մշակում (խառը գրելու ոճերը և բազմալեզու տեքստը մի բան են) [2]
-
Մարդու հետ կապի հնարավորություններ կարևոր ցանկացած հարցի համար (բժշկական, իրավաբանական, ֆինանսական):
Նաև՝ ձանձրալի, բայց իրական՝ այն պետք է մշակի ձեր մուտքագրումները՝ լուսանկարներ, PDF ֆայլեր, բազմաէջ սկանավորումներ և «ես սա նկարել եմ մեքենայի մեջ անկյան տակ» պատկերներ 😵: [2][3]
Համեմատական աղյուսակ. գործիքներ, որոնք մարդիկ օգտագործում են «Կարո՞ղ է արհեստական բանականությունը կարդալ ձեռագիր տառերով» հարցնելիս 🧰
Այստեղ գնային խոստումներ չկան (քանի որ գները սիրում են փոխվել): Սա հնարավորությունների տրամադրություն , այլ ոչ թե վճարման զամբյուղ:
| Գործիք / Հարթակ | Լավագույնը | Ինչու է այն աշխատում (և որտեղ՝ ոչ) |
|---|---|---|
| Google Cloud Vision (ձեռագիր OCR) [1] | Արագ արդյունահանում պատկերներից/սկանավորումներից | պատկերներում ձեռագիրը հայտնաբերելու համար |
| Microsoft Azure-ի ընթերցման OCR (Azure Vision / Փաստաթղթերի հետախուզություն) [2] | Խառը տպագիր + ձեռագիր փաստաթղթեր | Ակնհայտորեն աջակցում է տպագիր + ձեռագիր տեքստի արդյունահանմանը և տրամադրում է տեղորոշման + վստահության արժեք տեղում տեղադրված կոնտեյներների միջոցով ՝ տվյալների ավելի խիստ վերահսկողության համար։ [2] |
| Amazon Textract [3] | Ձևաթղթեր/կառուցվածքային փաստաթղթեր + ձեռագիր + «ստորագրված է» ստուգումներ | Արտահանում է տեքստ/ձեռագիր/տվյալներ և ներառում է ստորագրությունների գործառույթ, որը հայտնաբերում է ստորագրությունները/սկզբնատառերը և վերադարձնում է գտնվելու վայրը + վստահությունը ։ Հիանալի է, երբ ձեզ անհրաժեշտ է կառուցվածք. դեռևս անհրաժեշտ է վերանայել անկանոն պարբերությունները։ [3] |
| Տրանսկրիբուս [4] | Պատմական փաստաթղթեր + նույն ձեռքից գրված բազմաթիվ էջեր | Հզոր է, երբ կարող եք օգտագործել հանրային մոդելներ կամ մարզել հատուկ մոդելներ ՝ որոշակի ձեռագրի ոճի համար. «նույն հեղինակը, շատ էջեր» սցենարն է, որտեղ այն իսկապես կարող է փայլել: [4] |
| Կրակեն (OCR/HTR) [5] | Հետազոտություն + պատմական սցենարներ + անհատական ուսուցում | Բաց, մարզվող OCR/HTR, որը հատկապես հարմար է կապակցված սկրիպտների , քանի որ կարող է սովորել չբաժնված տողային տվյալներից (այնպես որ դուք ստիպված չեք լինի սկզբում շեղագիր տառերը կտրատել կատարյալ փոքրիկ տառերի): Կարգավորումն ավելի գործնական է: [5] |
Խորը ուսումնասիրություն. ինչպես է արհեստական բանականությունը կարդում շեղագիր տառերը ներսից 🧠
Շեղագիր ընթերցման հաջողված համակարգերի մեծ մասն ավելի շատ աշխատում է որպես տառադարձում, քան «յուրաքանչյուր տառը նկատելու»։ Ահա թե ինչու ժամանակակից OCR փաստաթղթերը խոսում են մեքենայական ուսուցման մոդելների և ձեռագրի արդյունահանման մասին, այլ ոչ թե պարզ նիշերի ձևանմուշների մասին։ [2][5]
Պարզեցված խողովակաշար
-
Նախնական մշակում (շտկում, աղմուկի նվազեցում, կոնտրաստի բարելավում)
-
Հայտնաբերել տեքստի հատվածները (որտեղ գրություն գոյություն ունի)
-
Գծային սեգմենտացիա (ձեռագրի տողերի առանձնացում)
-
Հաջորդականության ճանաչում (տեքստի կանխատեսում տողի երկայնքով)
-
Արդյունք + վստահություն (որպեսզի մարդիկ կարողանան վերանայել անորոշ մասերը) [2][3]
«Գծի վրայով հաջորդականության» գաղափարը մեծ պատճառ է, թե ինչու ձեռագրի մոդելները կարող են հաղթահարել շեղագիր տառատեսակը. դրանք ստիպված չեն կատարելապես «կռահել յուրաքանչյուր տառի սահմանը» [5]:
Ինչ որակ կարող եք իրատեսորեն ակնկալել (կախված օգտագործման դեպքից) 🎯
Սա այն մասն է, որը մարդիկ բաց են թողնում, իսկ հետո բարկանում։ Այսպիսով… ահա այն։.
Լավ հավանականություններ 👍
-
Մաքուր շեղագիր տողավոր թղթի վրա
-
Մեկ գրող, հետևողական ոճ
-
Բարձր թույլտվությամբ սկանավորում՝ լավ կոնտրաստով
-
Կարճ նշումներ՝ ընդհանուր բառապաշարով
Խառը հավանականություններ 😬
-
Դասարանային նշումներ (խզբզոցներ + նետեր + լուսանցքային քաոս)
-
Լուսապատճենների լուսապատճեններ (և երրորդ սերնդի անիծյալ մշուշոտ պատկերը)
-
Գունաթափված թանաքով օրագրեր
-
Մի քանի գրողներ նույն էջում
-
Նշումներ հապավումներով, մականուններով, ներքին կատակներով
Ռիսկային է՝ մի՛ վստահեք առանց վերանայման 🚩
-
Բժշկական տեղեկանքներ, իրավական երդումներ, ֆինանսական պարտավորություններ
-
Ամեն ինչ, որը պարունակում է անուններ, հասցեներ, անձնագրային համարներ, հաշվի համարներ
-
Պատմական ձեռագրեր՝ անսովոր ուղղագրությամբ կամ տառաձևերով
Եթե դա նշանակություն ունի, արհեստական բանականության արդյունքին վերաբերվեք որպես նախագծի, այլ ոչ թե վերջնական ճշմարտության։.
Աշխատանքային հոսքի օրինակ, որը սովորաբար գործում է.
ձեռագիր ընդունման ձևերի թվայնացման թիմը կատարում է OCR, այնուհետև միայն ձեռքով է ստուգում ցածր վստահության դաշտերը (անուններ, ամսաթվեր, ID համարներ): Սա է «արհեստական բանականությունը ենթադրում է, մարդը հաստատում է» օրինաչափությունը, և դա այն է, թե ինչպես եք պահպանում արագությունն ու բանականությունը: [2][3]
Ավելի լավ արդյունքներ ստանալ (արհեստական բանականությունը պակաս շփոթեցնող դարձնել) 🛠️
Նկարահանման խորհուրդներ (հեռախոսով կամ սկաներով)
-
Օգտագործեք հավասարաչափ լուսավորություն (խուսափեք ստվերներից էջի վրա)
-
Պահեք տեսախցիկը թղթին զուգահեռ
-
Ընտրեք ավելի բարձր լուծաչափ , քան կարծում եք, որ ձեզ անհրաժեշտ է
-
Խուսափեք ագրեսիվ «գեղեցկության ֆիլտրերից». դրանք կարող են ջնջել բարակ գծերը
Մաքրման խորհուրդներ (ճանաչումից առաջ)
-
Կտրել տեքստի հատվածին համապատասխան (ցտեսություն՝ սեղանի եզրեր, ձեռքեր, սուրճի բաժակներ ☕)
-
Մի փոքր բարձրացրեք կոնտրաստը (բայց թղթի հյուսվածքը մի՛ վերածեք ձնաբքի):
-
Ուղղեք էջը (ուղղեք անկյունը)
-
Եթե գծերը համընկնում են կամ եզրերը խառնաշփոթ են, բաժանեք առանձին պատկերների
Աշխատանքային հոսքի խորհուրդներ (մի փոքր հզոր)
-
Օգտագործեք ձեռագիր OCR (հնչում է ակնհայտ… մարդիկ դեռ բաց են թողնում այն) [1][2][3]
-
Վստահության գնահատականներ . նախ վերանայեք ցածր վստահության կետերը [2][3]
-
Եթե նույն հեղինակից շատ էջեր ունեք, մտածեք անհատական ուսուցման մասին (այդտեղ է տեղի ունենում «մեհ» → «վա՜յ» ցատկը) [4][5]
«Կարո՞ղ է արհեստական բանականությունը կարդալ ձեռագիր տառերով» ստորագրություններ և փոքրիկ գծագրեր 🖊️
Ստորագրություններն իրենք իրենց գազանն են։.
Ստորագրությունը հաճախ ավելի շատ նշանի , քան ընթեռնելի տեքստի, ուստի շատ փաստաթղթային համակարգեր այն դիտարկում են որպես հայտնաբերելի (և տեղորոշվող) բան, այլ ոչ թե «անվան տառադարձման»։ Օրինակ, Amazon Textract-ի «Ստորագրություններ գործառույթը կենտրոնանում է ստորագրությունների/սկզբնատառերի հայտնաբերման և գտնվելու վայրը + վստահությունը վերադարձնելու վրա, այլ ոչ թե «մուտքագրված անունը գուշակելու» վրա։ [3]
Այսպիսով, եթե ձեր նպատակը «անձի անունը ստորագրությունից հանելն է», ակնկալեք հիասթափություն, եթե ստորագրությունը հիմնականում ընթեռնելի ձեռագիր չէ։.
Գաղտնիություն և անվտանգություն. ձեռագիր նշումներ վերբեռնելը միշտ չէ, որ հանգիստ է 🔒
Եթե մշակում եք բժշկական գրառումներ, ուսանողների տեղեկություններ, հաճախորդների ձևաթղթեր կամ անձնական նամակներ, զգույշ եղեք, թե որտեղ են այդ պատկերները տեղափոխվում։.
Ավելի անվտանգ նախշեր
-
Սկզբում խմբագրեք նույնականացուցիչները (անուններ, հասցեներ, հաշվի համարներ)
-
Հնարավորության դեպքում զգայուն աշխատանքային բեռների համար նախընտրեք տեղական/տեղական
-
Պահպանեք մարդկային վերանայման ցիկլը կարևոր դաշտերի համար
Բոնուս. որոշ փաստաթղթերի աշխատանքային հոսքեր օգտագործում են նաև տեղանքի տեղեկատվություն (սահմանային վանդակներ)՝ խմբագրման խողովակաշարերը աջակցելու համար: [3]
Վերջնական մեկնաբանություններ 🧾✨
Կարո՞ղ է արհեստական բանականությունը կարդալ շեղագիր տառերով։ Այո, և դա զարմանալիորեն լավ է, երբ՝
-
պատկերը մաքուր է
-
ձեռագիրը ներդաշնակ է
-
գործիքը իսկապես նախատեսված է ձեռագրի ճանաչման համար [1][2][3]
Բայց շեղագիր տառատեսակը բնույթով խառնաշփոթ է, ուստի ազնիվ կանոնն է՝ օգտագործեք արհեստական բանականությունը՝ տառադարձումն արագացնելու համար, ապա վերանայեք արդյունքը ։
Հաճախակի տրվող հարցեր
Կարո՞ղ է արհեստական բանականությունը ճշգրիտ կարդալ շեղագիր ձեռագիրը։
Արհեստական բանականությունը կարող է կարդալ շեղագիր տառերով, սակայն ճշգրտությունը մեծապես կախված է նրանից, թե որքան կոկիկ և հետևողական է ձեռագիրը, և որքան պարզ է երևում պատկերը կամ սկանավորումը։ Շատ դեպքերում դա բավարար է գրառման էությունը ֆիքսելու համար։ Բարձր ռիսկային ցանկացած հարցի դեպքում, ինչպիսիք են անունները, հասցեները կամ բժշկական/իրավական բովանդակությունը, սպասեք սխալների և պլանավորեք մարդկային ստուգումը։.
Ո՞րն է ձեռագիր տեքստի համար լավագույն OCR տարբերակը՝ սովորական OCR-ը, թե՞ ձեռագիր OCR-ը։
Շեղագիր տառատեսակի համար ձեռագիր OCR-ն ավելի լավ է համապատասխանում, քան տպագիր տեքստի OCR-ը: Տպագիր OCR-ը նախատեսված է մաքուր, առանձնացված նիշերի համար, մինչդեռ շեղագիր տառատեսակը պահանջում է մոդելներ, որոնք կարող են մեկնաբանել կապակցված գծերը և բառային համատեքստը: Շատ հիմնական OCR հարթակներ այժմ ներառում են ձեռագիր տառատեսակի արդյունահանման գործառույթներ, որոնք սովորաբար ճիշտ տեղն են շեղագիր էջերի համար:.
Ինչո՞ւ շեղագիր տառատեսակն ավելի շատ սխալներ է առաջացնում, քան տպագիր տեքստը։
Շեղագիր տառատեսակն ավելի դժվար է գրել, քանի որ տառերը միանում են միմյանց, տարածությունների տատանումները, և անհատական գրելու ոճերը կարող են զգալիորեն տարբերվել։ Դա շատ ավելի քիչ ակնհայտ է դարձնում, թե որտեղ է ավարտվում մեկ տառը և սկսվում մյուսը, քան տպագիր տեքստի դեպքում։ Փոքր խնդիրները, ինչպիսիք են մշուշոտությունը, թույլ թանաքը կամ հյուսվածքային թուղթը, նույնպես կարող են ջնջել իմաստ պարունակող բարակ գծերը, ինչը արագորեն մեծացնում է ճանաչման սխալները։.
Որքանո՞վ է արհեստական բանականությունը հուսալի ձեռագիր անունները, հասցեները և անձնագրային համարները կարդալու համար։
Սա ամենաբարձր ռիսկի կատեգորիան է: Նույնիսկ երբ արհեստական բանականությունը լավ է մշակում շրջապատող տեքստը, կարևորագույն դաշտերը, ինչպիսիք են անունները, հասցեները, հաշվի համարները կամ ID-ները, այն են, որտեղ ճանաչման աննշան սխալները մեծ հետևանքներ են ունենում: Տարածված մոտեցում է արհեստական բանականության արդյունքը որպես սևագիր դիտարկելը. օգտագործեք վստահության միավորներ՝ անորոշ բաժինները նշելու համար, ապա առաջնահերթություն տվեք այդ կարևորագույն դաշտերի ձեռքով վերանայմանը:.
Ո՞րն է լավագույն աշխատանքային հոսքը՝ շեղագիր տառերը մասշտաբային հուսալիորեն կարդալու համար։
Գործնական աշխատանքային հոսքը հետևյալն է. «Արհեստական բանականությունը հուշում է, մարդը հաստատում է»: Գործարկեք ձեռագրի OCR-ը, այնուհետև վերանայեք ցածր վստահության արդյունքները՝ ամեն ինչ ստուգելու փոխարեն: Շատ OCR համակարգեր տրամադրում են վստահության միավորներ և գտնվելու վայրի տվյալներ (օրինակ՝ սահմանազատման վանդակներ), որոնք օգնում են ձեզ արագ գտնել այն մասերը, որոնք, ամենայն հավանականությամբ, սխալ կլինեն: Այս մոտեցումը գործնականում հավասարակշռում է փաստաթղթերի արագությունը ճշգրտության հետ:.
Ինչպե՞ս կարող եմ բարելավել հեռախոսի լուսանկարներից ստացված շեղագիր OCR արդյունքները։
Լուսանկարի որակը շատ կարևոր է: Օգտագործեք հավասարաչափ լուսավորություն՝ ստվերներից խուսափելու համար, պահեք տեսախցիկը էջին զուգահեռ՝ աղավաղումը նվազեցնելու համար, և ընտրեք ավելի բարձր լուծաչափ, քան կարծում եք, որ անհրաժեշտ է: Տեքստի հատվածին համապատասխան կտրելը, կոնտրաստի ուշադիր ուժեղացումը և պատկերի թեքությունը նվազեցնելը կարող են նվազեցնել սխալները: Խուսափեք ծանր «գեղեցկության» ֆիլտրերից, որոնք կարող են վերացնել գրիչի բարակ գծերը:.
Կարո՞ղ է արհեստական բանականությունը կարդալ շեղագիր ստորագրությունները և դրանք վերածել տպագրված անունների։
Ստորագրությունները սովորաբար տարբեր կերպ են մշակվում սովորական ձեռագրից, քանի որ դրանք հաճախ ավելի մոտ են նշանին, քան ընթեռնելի տեքստին: Շատ համակարգեր կենտրոնանում են ստորագրության առկայությունը և տեղը հայտնաբերելու (և վստահություն ապահովելու) վրա, այլ ոչ թե այն անձի մուտքագրված անունով տառադարձելու վրա: Եթե ձեզ անհրաժեշտ է ստորագրողի անունը, սովորաբար կհիմնվեք առանձին տպագիր դաշտի կամ ձեռքով հաստատման վրա:.
Արժե՞ մարզել շեղագիր ձեռագրի համար նախատեսված անհատական մոդել։
Այդպես կարող է լինել, հատկապես, եթե նույն հեղինակի կողմից գրված բազմաթիվ էջեր կամ փաստաթղթերում նույն ձեռագրի ոճը համընկնում է: «Նույն ձեռագիր, շատ էջեր» սցենարներում անհատականացված ուսուցումը կարող է զգալիորեն բարելավել արդյունքները՝ համեմատած ընդհանուր մոդելների հետ: Եթե ձեր մուտքագրումները տարբերվում են տարբեր հեղինակների և ոճերի միջև, շահույթը հաճախ ավելի փոքր է, և դուք դեռ կցանկանաք վերանայման քայլ կատարել:.
Անվտա՞նգ է ձեռագիր նշումներ վերբեռնել OCR ծառայության մեջ։
Դա կախված է բովանդակության զգայունությունից և մշակման վայրից: Եթե դուք զբաղվում եք անձնական փաստաթղթերով, ինչպիսիք են բժշկական գրառումները, ուսանողների տվյալները կամ հաճախորդների ձևաթղթերը, ավելի անվտանգ մոտեցում է նախ խմբագրել նույնականացուցիչները և օգտագործել ավելի խիստ տեղակայման տարբերակներ, երբ դրանք հասանելի են: Կարևոր դաշտերի համար մարդկային վերանայման ցիկլի պահպանումը նաև նվազեցնում է սխալ արդյունահանումների հիման վրա գործողությունների ռիսկը:.
Հղումներ
[1] Google Cloud OCR-ի օգտագործման դեպքի ակնարկ, ներառյալ Cloud Vision-ի միջոցով ձեռագրի հայտնաբերման աջակցությունը։ կարդալ ավելին
[2] Microsoft-ի OCR (Կարդալ) ակնարկը, որը ներառում է տպագիր + ձեռագրի արդյունահանումը, վստահության գնահատականները և կոնտեյներների տեղակայման տարբերակները։ ավելին
[3] AWS գրառումը, որը բացատրում է Textract-ի ստորագրությունների գործառույթը՝ ստորագրությունների/սկզբնատառերի հայտնաբերման համար՝ տեղորոշմամբ + վստահության արտածմամբ։ կարդալ ավելին
[4] Transkribus-ի ուղեցույց այն մասին, թե ինչու (և երբ) մարզել տեքստի ճանաչման մոդել որոշակի ձեռագրի ոճերի համար։ կարդալ ավելին
[5] Kraken-ի փաստաթղթերը OCR/HTR մոդելների մարզման վերաբերյալ՝ օգտագործելով չբաժնեծված գծային տվյալներ միացված սկրիպտների համար։ կարդալ ավելին