Ի՞նչ է Edge AI-ը։

Edge AI-ը ինտելեկտը տարածում է այնտեղ, որտեղ տվյալները ծնվում են։ Հնչում է շքեղ, բայց հիմնական գաղափարը պարզ է՝ մտածեք անմիջապես սենսորի կողքին, որպեսզի արդյունքները երևան հիմա, ոչ թե ուշ։ Դուք ստանում եք արագություն, հուսալիություն և պատշաճ գաղտնիության պատմություն՝ առանց ամպային համակարգի կողմից յուրաքանչյուր որոշման խնամքի։ Եկեք բացատրենք՝ ներառյալ կարճ ճանապարհներն ու կողմնակի առաջադրանքները։ 😅

Հոդվածներ, որոնք կարող են ձեզ դուր գալ կարդալ սրանից հետո

🔗 Ի՞նչ է գեներատիվ արհեստական բանականությունը
Գեներատիվ արհեստական բանականության, դրա աշխատանքի և գործնական կիրառությունների հստակ բացատրություն։

🔗 Ի՞նչ է գործակալական արհեստական բանականությունը
Գործակալական արհեստական բանականության, ինքնավար վարքագծի և իրական աշխարհի կիրառման օրինաչափությունների ակնարկ։

🔗 Ի՞նչ է արհեստական բանականության մասշտաբայնությունը
Սովորեք, թե ինչպես հուսալիորեն, արդյունավետորեն և ծախսարդյունավետ կերպով մասշտաբավորել արհեստական բանականության համակարգերը։

🔗 Ի՞նչ է արհեստական բանականության համար նախատեսված ծրագրային շրջանակը
Արհեստական ինտելեկտի ծրագրային շրջանակների, ճարտարապետության առավելությունների և իրականացման հիմունքների վերլուծություն։

Ի՞նչ է Edge AI-ը։ Հակիրճ սահմանում 🧭

Edge AI-ն մեքենայական ուսուցման մոդելների վարժեցված մոդելների աշխատեցման պրակտիկա է անմիջապես տվյալներ հավաքող սարքերի վրա կամ դրանց մոտակայքում՝ հեռախոսներ, տեսախցիկներ, ռոբոտներ, մեքենաներ, կրելի սարքեր, արդյունաբերական կառավարիչներ և այլն: Հեռավոր սերվերներ վերլուծության համար հում տվյալները ուղարկելու փոխարեն, սարքը մշակում է մուտքային տվյալները տեղում և ուղարկում է միայն ամփոփումներ կամ ընդհանրապես ոչինչ: Ավելի քիչ երկկողմանի ուղևորություններ, ավելի քիչ ուշացում, ավելի շատ վերահսկողություն: Եթե ցանկանում եք մաքուր, մատակարարից չեզոք բացատրություն, սկսեք այստեղից: [1]

Ի՞նչն է Edge AI-ը դարձնում իրականում օգտակար։ 🌟

Ցածր լատենտություն - որոշումները կայացվում են սարքի վրա, ուստի արձագանքները ակնթարթային են ընկալման առաջադրանքների համար, ինչպիսիք են օբյեկտի հայտնաբերումը, արթնացող բառերի հայտնաբերումը կամ անոմալիաների մասին ծանուցումները: [1]
Գաղտնիություն ըստ տեղանքի . զգայուն տվյալները կարող են մնալ սարքում, նվազեցնելով դրանց ազդեցությունը և օգնելով տվյալների նվազագույնի հասցնելու քննարկումներին: [1]
Թողունակության խնայողություն - ուղարկեք հատկանիշներ կամ իրադարձություններ՝ հում հոսքերի փոխարեն։ [1]
Դիմացկունություն - աշխատում է անկայուն կապի դեպքում։
Ծախսերի վերահսկում - ավելի քիչ ամպային հաշվարկային ցիկլեր և ավելի ցածր ելք։
Համատեքստի գիտակցում . սարքը «զգում» է միջավայրը և հարմարվում է։

Կարճ պատմություն. մանրածախ առևտրի օդաչուն տեսախցիկի անընդհատ բեռնումները փոխարինեց սարքի վրա գտնվող անձի և օբյեկտի դասակարգմամբ և ուղարկեց միայն ժամային հաշվարկներ և բացառությունների տեսագրություններ: Արդյունք. 200 մվ-ից պակաս ազդանշաններ դարակի եզրին և վերբեռնման երթևեկության մոտ 90% անկում՝ առանց խանութի WAN պայմանագրերը փոխելու: (Մեթոդ. տեղական եզրակացություն, իրադարձությունների խմբաքանակ, միայն անոմալիաներ):

Edge AI vs cloud AI - արագ հակադրություն 🥊

Հաշվարկի վայրը՝ եզր = սարքի վրա/սարքի մոտ; ամպ = հեռակա տվյալների կենտրոններ։
Լատենտություն՝ եզր ≈ իրական ժամանակում; ամպն ունի երկկողմանի երթուղիներ։
Տվյալների տեղաշարժ. եզրը նախ ֆիլտրում/սեղմում է. ամպային տեխնոլոգիաները սիրում են լիարժեք ճշգրտությամբ վերբեռնումներ։
Հուսալիություն. Edge-ը շարունակում է աշխատել անցանց ռեժիմով, ամպային սերվերներին անհրաժեշտ է միացում։
Կառավարում. Edge-ը աջակցում է տվյալների նվազագույնի հասցնելուն, ամպային տեխնոլոգիաները կենտրոնացնում են վերահսկողությունը։ [1]

Սա կամ-կամ չէ։ Խելացի համակարգերը համատեղում են երկուսն էլ՝ արագ տեղական որոշումներ, ավելի խորը վերլուծություններ և կենտրոնացված ուսուցում նավատորմի վրա։ Հիբրիդային պատասխանը և՛ ձանձրալի է, և՛ ճիշտ։

Ինչպես է Edge AI-ն իրականում աշխատում ներսից 🧩

Սենսորները գրանցում են հում ազդանշաններ՝ աուդիո կադրեր, տեսախցիկի պիքսելներ, IMU-ի թակոցներ, տատանումների հետքեր։
Նախնական մշակումը վերաձևավորում է այդ ազդանշանները՝ դարձնելով դրանք մոդելին հարմար հատկանիշներ։
Inference runtime-ը սարքի վրա կատարում է կոմպակտ մոդել՝ օգտագործելով արագացուցիչներ, երբ դրանք հասանելի են։
Հետմշակումը ելքային տվյալները վերածում է իրադարձությունների, պիտակների կամ կառավարման գործողությունների:
Հեռաչափությունը վերբեռնում է միայն օգտակար տվյալները՝ ամփոփումներ, անոմալիաներ կամ պարբերական հետադարձ կապ։

Սարքի վրա առկա աշխատաժամանակի տարբերակներից են Google-ի LiteRT-ը (նախկինում՝ TensorFlow Lite), ONNX Runtime-ըև Intel-ի OpenVINO-ն: Այս գործիքակազմերը քվանտացման և օպերատորների միաձուլման նման հնարքներով խնայում են թողունակությունը՝ օգտագործելով սահմանափակ հզորության/հիշողության բյուջեներ: Եթե ձեզ դուր են գալիս մանրամասները, ապա դրանց փաստաթղթերը հուսալի են: [3][4]

Որտեղ է այն երևում. իրական օգտագործման դեպքեր, որոնք կարող եք մատնանշել 🧯🚗🏭

Տեսողություն եզրին. դռան զանգի տեսախցիկներ (մարդիկ ընդդեմ կենդանիների), խանութների դարակների սկանավորում, անօդաչու սարքերի կողմից թերությունների հայտնաբերում։
Սարքի վրա ձայնագրություն. արթնացման բառեր, թելադրանք, բույսերի արտահոսքի հայտնաբերում:
Արդյունաբերական Ինտերնետի իրերի համակարգ. շարժիչներն ու պոմպերը վերահսկվում են տատանումների անոմալիաների հայտնաբերման համար՝ խափանումից առաջ։
Ավտոմոբիլային՝ վարորդի մոնիթորինգ, երթևեկության գոտիների հայտնաբերում, կայանման օժանդակ միջոցներ՝ վայրկյանից մի փոքր պակաս կամ կանգառի դեպքում։
Առողջապահություն. կրելի սարքերը տեղում են նշում առիթմիաները, համաժամեցրեք ամփոփագրերը ավելի ուշ։
Սմարթֆոններ. լուսանկարների բարելավում, սպամ-զանգերի հայտնաբերում, «ինչպե՞ս է իմ հեռախոսը դա արել անցանց ռեժիմում» պահեր։

Ֆորմալ սահմանումների (և «մշուշն ընդդեմ եզրի» զրույցի) համար տե՛ս NIST կոնցեպտուալ մոդելը։ [2]

Սարքավորումներ, որոնք այն դարձնում են արագաշարժ 🔌

Մի քանի հարթակներ հաճախ են ստուգվում անուններով՝

NVIDIA Jetson - GPU-ով աշխատող մոդուլներ ռոբոտների/տեսախցիկների համար՝ շվեյցարական բանակային դանակի ոճով ներկառուցված արհեստական բանականության համար։
Google Edge TPU + LiteRT - արդյունավետ ամբողջ թվերի եզրակացություն և օպտիմալացված աշխատանքային ժամանակ գերցածր էներգիայի նախագծերի համար: [3]
Apple Neural Engine (ANE) - iPhone-ի, iPad-ի և Mac-ի համար նախատեսված սարքի վրա հիմնված ML։ Apple-ը հրապարակել է գործնական աշխատանք ANE-ում տրանսֆորմատորների արդյունավետ տեղակայման վերաբերյալ։ [5]
Intel պրոցեսորներ/iGPU-ներ/NPU-ներ OpenVINO-ով - «գրեք մեկ անգամ, տեղակայեք ցանկացած վայրում» Intel սարքավորումների վրա. օգտակար օպտիմալացման անցումներ։
ONNX Runtime ամենուրեք - չեզոք runtime՝ հեռախոսների, համակարգիչների և դարպասների համար միացվող կատարման մատակարարներով։ [4]

Ձեզ բոլորն էլ պե՞տք են։ Իրականում ոչ։ Ընտրեք մեկ ուժեղ ուղի, որը համապատասխանում է ձեր նավատորմին և հետևեք դրան. թիմերի արտահոսքը ներդրված թիմերի թշնամին է։

Ծրագրային ապահովման փաթեթ - կարճ շրջագայություն 🧰

Մոդելի սեղմում. քվանտացում (հաճախ մինչև int8), կտրում, թորում։
Օպերատորի մակարդակի արագացում. միջուկները կարգավորվել են ձեր սիլիցիումին։
Գործողության ժամկետներ՝ LiteRT, ONNX Runtime, OpenVINO: [3][4]
Տեղակայման փաթաթաններ՝ կոնտեյներներ/հավելվածների փաթեթներ; երբեմն միկրոսերվիսներ դարպասների վրա։
MLOps եզրերի համար. OTA մոդելի թարմացումներ, A/B թողարկում, հեռաչափման ցիկլեր։
Գաղտնիության և անվտանգության վերահսկում. սարքի վրա կոդավորում, անվտանգ բեռնում, հավաստագրում, անկլավներ։

Փոքր դեպք. ստուգող անօդաչու թռչող սարքի թիմը ծանր դետեկտորը ներմուծեց LiteRT-ի համար նախատեսված քվանտացված ուսանողական մոդելի մեջ, այնուհետև միացրեց NMS-ը սարքի վրա: Թռիչքի ժամանակը բարելավվեց մոտ 15%-ով՝ հաշվողական ծախսերի նվազման շնորհիվ. բացառության շրջանակներում վերբեռնման ծավալը կրճատվեց: (Մեթոդ. տվյալների հավաքագրում տեղում, հետքվանտային կարգաբերում, ստվերային ռեժիմ A/B՝ լրիվ տեղակայումից առաջ):

Համեմատական աղյուսակ - Edge AI-ի հայտնի տարբերակներ 🧪

Իրական խոսք. այս սեղանը կարծիքային է և մի փոքր անկարգ՝ ճիշտ ինչպես իրական աշխարհը։

Գործիք / Հարթակ	Լավագույն լսարանը	Փրայս մարզադաշտ	Ինչու է այն աշխատում եզրին
LiteRT (նախկինում՝ TFLite)	Android, մշակողներ, ներդրված	$-ից $$	Lean runtime, հզոր փաստաթղթեր, բջջային սարքերի համար նախատեսված օպերացիոն համակարգեր։ Հիանալի աշխատում է նաև անցանց ռեժիմում։ [3]
ONNX-ի աշխատանքային ժամանակ	Խաչաձև հարթակային թիմեր	$	Չեզոք ձևաչափ, միացվող սարքավորումներով հագեցած ներքին համակարգ՝ ապագայի համար հարմար։ [4]
ԲացելՎԻՆՈ	Intel-կենտրոն տեղակայումներ	$	Մեկ գործիքակազմ, Intel-ի բազմաթիվ թիրախներ. հարմար օպտիմալացման անցումներ։
NVIDIA Jetson	Ռոբոտաշինություն, տեսողական ծանրաբեռնվածություն	$$-ից մինչև $$$	GPU արագացում ճաշի տուփում. լայն էկոհամակարգ։
Apple ANE	iOS/iPadOS/macOS հավելվածներ	սարքի արժեքը	Հզոր սարքային/ծրագրային ապահովման ինտեգրացիա; լավ փաստաթղթավորված ANE տրանսֆորմատորային աշխատանք: [5]
Edge TPU + LiteRT	Գերցածր էներգիայի նախագծեր	$	Արդյունավետ int8 եզրակացություն եզրին. փոքր, բայց հզոր։ [3]

Ինչպես ընտրել Edge AI ուղի՝ փոքրիկ որոշումների ծառ 🌳

Դժվար է իրական ժամանակում ապրել ձեր կյանքը։ Սկսեք արագացուցիչներից + քվանտացված մոդելներից։
Շատ սարքերի տեսակներ՞։ Փոխադրելիության համար նախընտրեք ONNX Runtime-ը կամ OpenVINO-ն։ [4]
Բջջային հավելված ուղարկելը՞։ LiteRT-ը նվազագույն դիմադրության ուղին է։ [3]
Ռոբոտաշինությո՞ւն, թե՞ տեսախցիկի վերլուծություն: Jetson-ի GPU-ի հետ հարմարեցված գործողությունները խնայում են ժամանակ:
Խիստ գաղտնիության քաղաքականություն՞: Պահեք տվյալները տեղական, կոդավորեք հանգստի վիճակում, գրանցեք ագրեգատներ, այլ ոչ թե հում կադրեր:
Փոքր թիմ ունե՞ք։ Խուսափեք էկզոտիկ գործիքաշղթաներից. ձանձրալի լինելը գեղեցիկ է։
Մոդելները հաճախ կփոխվե՞ն։ Առաջին օրվանից պլանավորեք OTA-ն և հեռաչափումը։

Ռիսկերը, սահմանափակումները և ձանձրալի, բայց կարևոր մանրամասները 🧯

Մոդելի շեղում - միջավայրերի փոփոխություն; բաշխումների մոնիթորինգ, ստվերային ռեժիմների գործարկում, պարբերաբար վերապատրաստում։
Հաշվարկային առաստաղներ - հիշողության/հզորության սահմանափակությունը պարտադրում է ավելի փոքր մոդելներ կամ թույլ ճշգրտություն։
Անվտանգություն - ենթադրեք ֆիզիկական մուտք; օգտագործեք անվտանգ բեռնում, ստորագրված արտեֆակտներ, ատեստավորում, ամենաքիչ արտոնություններով ծառայություններ:
Տվյալների կառավարում . տեղական մշակումը օգնում է, բայց ձեզ դեռ անհրաժեշտ է համաձայնություն, պահպանում և շրջանակային հեռաչափում:
Ֆլոտացիայի գործողություններ - սարքերը անջատվում են ամենավատ ժամանակներին. նախագծեք հետաձգված թարմացումներ և վերսկսվող վերբեռնումներ:
Տաղանդների խառնուրդ - ներդրված + մեքենայական ուսուցման + DevOps-ը խայտաբղետ անձնակազմ է. վաղ փուլում խաչաձև վերապատրաստում։

Գործնական ուղեցույց՝ օգտակար բան առաքելու համար 🗺️

Ընտրեք մեկ օգտագործման դեպք՝ 3-րդ տողում չափելի արժեք-թերության հայտնաբերմամբ, խելացի բարձրախոսի վրա արթնացման բառով և այլն։
Հավաքեք կոկիկ տվյալների բազմություն, որը արտացոլում է թիրախային միջավայրը, ներարկեք աղմուկ՝ իրականությանը համապատասխանեցնելու համար։
Նախատիպ մշակողի հավաքածուի վրա, որը մոտ է արտադրական սարքավորումներին։
Սեղմեք մոդելը քվանտացման/կտրման միջոցով, չափեք ճշգրտության կորուստը ազնվորեն։ [3]
Եզրակացությունը փաթեթավորեք մաքուր API-ում ՝ հետադարձ ճնշման և հսկիչների միջոցով, քանի որ սարքերը կախվում են ժամը 2-ին։
Նախագծեք հեռաչափություն , որը հարգում է գաղտնիությունը. ուղարկումների քանակ, հիստոգրամներ, եզրերից արդյունահանված հատկանիշներ։
Harden անվտանգություն. ստորագրված երկուական ֆայլեր, անվտանգ բեռնում, նվազագույն ծառայություններ բաց են։
OTA պլան՝ աստիճանական տեղակայումներ, կանարիներ, ակնթարթային հետադարձ կապ։
օդաչուն նետեք անհարթ անկյունային պատյանի մեջ. եթե այն այնտեղ դիմանա, ապա կդիմանա ամենուր։
Մասշտաբավորվեք ձեռնարկի միջոցով. ինչպես ավելացնել մոդելներ, պտտել բանալիները, արխիվացնել տվյալները, որպեսզի #2 նախագիծը քաոս չլինի։

Հաճախակի տրվող հարցեր - կարճ պատասխաններ «Ի՞նչ է Edge AI-ի հետաքրքրասիրությունները» թեմայի շուրջ։

Արդյո՞ք Edge AI-ը պարզապես փոքր մոդել է աշխատեցնում փոքրիկ համակարգչի վրա:
Մեծ մասամբ՝ այո, բայց չափը ամբողջ պատմությունը չէ: Այն նաև վերաբերում է լատենտության բյուջեներին, գաղտնիության խոստումներին և բազմաթիվ սարքերի տեղական, բայց գլոբալ մակարդակով աշխատելուն: [1]

Կարո՞ղ եմ մարզվել նաև եզրային հատվածում:
Թեթև սարքի վրա մարզումը/անհատականացումը գոյություն ունի, ավելի ծանր մարզումները դեռևս կենտրոնացված են: ONNX Runtime-ը փաստաթղթավորում է սարքի վրա մարզման տարբերակները, եթե դուք արկածախնդիր եք: [4]

Ի՞նչ է Edge AI-ը ընդդեմ fog computing-ի:
Fog-ը և edge-ը զարմիկներ են: Երկուսն էլ հաշվողական տեխնիկան ավելի են մոտեցնում տվյալների աղբյուրներին, երբեմն՝ մոտակա դարպասների միջոցով: Պաշտոնական սահմանումների և համատեքստի համար տե՛ս NIST: [2]

Արդյո՞ք Edge AI-ը միշտ է բարելավում գաղտնիությունը։
Այն օգնում է, բայց դա կախարդանք չէ։ Ձեզ դեռ անհրաժեշտ է նվազագույնի հասցնել, անվտանգ թարմացման ուղիներ և ուշադիր գրանցում։ Գաղտնիությանը վերաբերվեք որպես սովորության, այլ ոչ թե որպես նշման վանդակի։

Խորը վերլուծություններ, որոնք կարող եք կարդալ 📚

1) Մոդելի օպտիմալացում, որը չի խաթարում ճշգրտությունը

Քվանտացումը կարող է կրճատել հիշողությունը և արագացնել գործողությունները, բայց չափաբերեք ներկայացուցչական տվյալներով, հակառակ դեպքում մոդելը կարող է սկյուռիկներ տեսնել այնտեղ, որտեղ կան երթևեկության կոներ: Թորումը, երբ ուսուցիչը ուղղորդում է ավելի փոքր աշակերտին, հաճախ պահպանում է իմաստաբանությունը: [3]

2) Եզրային եզրակացության կատարման ժամանակները գործնականում

LiteRT-ի մեկնաբանիչը միտումնավոր կերպով անստատիկ հիշողության կորուստ է կատարում կատարման ժամանակ: ONNX-ի կատարման ժամանակը միանում է տարբեր արագացուցիչների կատարման մատակարարների միջոցով: Երկուսն էլ հուսալի են. երկուսն էլ հզոր մուրճեր են: [3][4]

3) Կայունություն վայրի բնության մեջ

Ջերմություն, փոշի, անկայուն հոսանք, անփույթ Wi-Fi. կառուցեք հսկիչներ, որոնք վերագործարկում են խողովակաշարերը, պահպանում որոշումները և համաձայնեցնում ցանցի վերադարձի դեպքում: Ավելի քիչ հմայիչ, քան ուշադրության կենտրոնները, սակայն ավելի կարևոր են:

Արտահայտություն, որը դուք կկրկնեք հանդիպումների ժամանակ - Ի՞նչ է Edge AI-ը 🗣️

Edge AI-ն ինտելեկտը մոտեցնում է տվյալներին՝ բավարարելու համար լատենտության, գաղտնիության, թողունակության և հուսալիության գործնական սահմանափակումները: Կախարդանքը մեկ չիպի կամ շրջանակի մեջ չէ, այլ իմաստուն կերպով ընտրելն է՝ ինչը որտեղ հաշվարկել:

Վերջնական դիտողություններ - Շատ երկար է, չեմ կարդացել 🧵

Edge AI-ը մոդելները գործարկում է տվյալների մոտ, որպեսզի արտադրանքը արագ, գաղտնի և կայուն զգա։ Դուք կհամատեղեք տեղական եզրակացությունը ամպային վերահսկողության հետ՝ երկու աշխարհների լավագույնը ստանալու համար։ Ընտրեք ձեր սարքերին համապատասխանող աշխատանքային ժամանակ, հենվեք արագացուցիչների վրա, երբ հնարավոր է, մոդելները պահեք կոկիկ՝ սեղմելով, և նախագծեք նավատորմի գործողությունները այնպես, կարծես ձեր աշխատանքը կախված է դրանից, որովհետև, այո, կարող է։ Եթե ինչ-որ մեկը հարցնի՝ ի՞նչ է Edge AI-ը, ասեք՝ խելացի որոշումներ, որոնք կայացվում են տեղում, ժամանակին։ Այնուհետև ժպտացեք և թեման փոխեք մարտկոցների վրա։ 🔋🙂

Հղումներ

IBM - Ի՞նչ է Edge AI-ը (սահմանում, առավելություններ):
https://www.ibm.com/think/topics/edge-ai
NIST - SP 500-325: Մշուշի հաշվարկման կոնցեպտուալ մոդել (մշուշի/եզրի ֆորմալ համատեքստ):
https://csrc.nist.gov/pubs/sp/500/325/final
Google AI Edge - LiteRT (նախկինում՝ TensorFlow Lite) (աշխատանքային ժամանակ, քվանտացում, միգրացիա):
https://ai.google.dev/edge/littert
ONNX Runtime - Սարքի վրա աշխատեցում (շարժական աշխատեցում + եզրային սարքերի վրա աշխատեցում):
https://onnxruntime.ai/docs/get-started/training-on-device.html
Apple-ի մեքենայական ուսուցման հետազոտություն - Տրանսֆորմատորների տեղակայում Apple-ի նեյրոնային շարժիչի վրա (ANE արդյունավետության նշումներ):
https://machinelearning.apple.com/research/neural-engine-transformers

Գտեք արհեստական բանականության վերջին նորույթները պաշտոնական արհեստական բանականության օգնականների խանութում

Մեր մասին

Վերադառնալ բլոգ