Ի՞նչ են արհեստական բանականության մոդելները։ Խորը ուսումնասիրություն։

Երբևէ հայտնվե՞լ եք գիշերվա ժամը 2-ին թերթելիս և հարցնելով, թե ի՞նչ են արհեստական ինտելեկտի մոդելները , և ինչո՞ւ են բոլորը խոսում դրանց մասին այնպես, կարծես դրանք կախարդական կախարդանքներ լինեն։ Նույնն է։ Այս հոդվածը իմ ոչ այնքան պաշտոնական, երբեմն կողմնակալ ուղեցույցն է, որը ձեզ կտանի «ոչ մի պատկերացում»-ից մինչև «վտանգավոր կերպով ինքնավստահ ընթրիքների ժամանակ»։ Մենք կանդրադառնանք հետևյալին. ինչ են նրանք, ինչն է նրանց դարձնում իրականում օգտակար (ոչ միայն փայլուն), ինչպես են նրանց մարզում, ինչպես ընտրել՝ առանց անվճռականության մեջ ընկնելու, և մի քանի թակարդներ, որոնց մասին դուք իմանում եք միայն ցավից հետո։

Հոդվածներ, որոնք կարող են ձեզ դուր գալ կարդալ սրանից հետո

🔗 Ի՞նչ է արհեստական բանականության արբիտրաժը. այս տարածված բառի հետևում կանգնած ճշմարտությունը
Բացատրում է արհեստական բանականության արբիտրաժը, դրա աղմուկը և իրական հնարավորությունները։.

🔗 Ի՞նչ է խորհրդանշական արհեստական բանականությունը. Ամեն ինչ, ինչ դուք պետք է իմանաք
Ներառում է խորհրդանշական արհեստական բանականությունը, դրա մեթոդները և ժամանակակից կիրառությունները։.

🔗 Արհեստական բանականության տվյալների պահպանման պահանջները. Ինչ պետք է իմանաք
Բաշխում է արհեստական ինտելեկտի տվյալների պահպանման կարիքները և գործնական նկատառումները։.

Ուրեմն… իրականում ի՞նչ են արհեստական բանականության մոդելները։ 🧠

Առավել պարզեցված ձևով՝ արհեստական բանականության մոդելը պարզապես սովորած։ Դուք նրան տալիս եք մուտքային տվյալներ, այն տալիս է ելքային տվյալներ։ Խնդիրն այն է, որ այն հասկանում է, թե ինչպես ՝ մանրակրկիտ ուսումնասիրելով բազմաթիվ օրինակներ և ամեն անգամ իրեն «ավելի քիչ սխալ» թույլ տալով։ Բավականաչափ կրկնեք սա, և այն սկսում է նկատել այնպիսի օրինաչափություններ, որոնց գոյության մասին դուք նույնիսկ չգիտեիք։

Եթե լսել եք գծային ռեգրեսիայի, որոշման ծառերի, նեյրոնային ցանցերի, տրանսֆորմատորների, դիֆուզիոն մոդելների կամ նույնիսկ k-ամենամոտ հարևանների նման անուններ, այո, դրանք բոլորը նույն թեմայի շուրջ են. տվյալները մտնում են, մոդելը սովորում է քարտեզագրումը, արդյունքը դուրս է գալիս։ Տարբեր զգեստներ, նույն ներկայացումը։.

Ի՞նչն է տարբերում խաղալիքները իրական գործիքներից ✅

Շատ մոդելներ հիանալի տեսք ունեն ցուցադրական տարբերակում, բայց արտադրության ընթացքում ձախողվում են։ Մոդելները, որոնք մնում են, սովորաբար ունեն մեծահասակների համար բնորոշ գծերի կարճ ցանկ

Ընդհանրացում - մշակում է այն տվյալները, որոնք դրանք երբեք չեն տեսել՝ առանց մասնատվելու։
Հուսալիություն - չի գործում մետաղադրամ նետելու պես, երբ մուտքային տվյալները տարօրինակ են դառնում:
Անվտանգություն և պաշտպանվածություն - ավելի դժվար է խաղալ կամ չարաշահել:
Բացատրելիություն ՝ ոչ միշտ բյուրեղյա պարզ, բայց առնվազն վրիպազերծելի։
Գաղտնիություն և արդարություն . հարգում է տվյալների սահմանները և չի պարունակում կողմնակալություն։
Արդյունավետություն ՝ բավականաչափ մատչելի՝ մասշտաբային առումով աշխատելու համար։

Սա, ըստ էության, «լվացքի ցուցակի» կարգավորող մարմինների և ռիսկերի շրջանակների սերն է՝ վավերականություն, անվտանգություն, հաշվետվողականություն, թափանցիկություն, արդարություն, բոլոր լավագույն նվաճումները։ Բայց ազնվորեն ասած, սրանք հաճելի բաներ չեն. եթե մարդիկ կախված են ձեր համակարգից, նրանք «սեղանի խաղադրույքներ» են։.

Արագ բանականության ստուգում. մոդելներն ընդդեմ ալգորիթմների ընդդեմ տվյալների 🤷

Ահա երեք մասից բաղկացած բաժանումը

Մոդել - սովորած «բառը», որը մուտքային տվյալները վերածում է ելքային տվյալների։
Ալգորիթմ - մոդելը մարզող կամ գործարկող բաղադրատոմսը (պատկերացրեք գրադիենտային իջնում, ճառագայթի որոնում):
Տվյալներ ՝ հում օրինակներ, որոնք մոդելին սովորեցնում են, թե ինչպես վարվել։

Մի փոքր անհարմար փոխաբերություն. տվյալները ձեր բաղադրիչներն են, ալգորիթմը՝ բաղադրատոմսը, իսկ մոդելը՝ տորթը։ Երբեմն այն համեղ է լինում, երբեմն էլ՝ մեջտեղում է մնում, որովհետև դուք շատ շուտ եք նայել։.

Արհեստական բանականության մոդելների ընտանիքներ, որոնց դուք իրականում կհանդիպեք 🧩

Կան անվերջ կատեգորիաներ, բայց ահա գործնական դասավորությունը

Գծային և լոգիստիկ մոդելներ ՝ պարզ, արագ, մեկնաբանելի։ Աղյուսակային տվյալների համար դեռևս անգերազանցելի բազային գծեր։
Ծառեր և համույթներ . որոշման ծառերը «եթե»-«ապա» բաժանումներ են. միավորեք անտառը կամ ուժեղացրեք դրանք, և դրանք զարմանալիորեն ուժեղ կլինեն։
Կոնվոլյուցիոն նեյրոնային ցանցեր (CNN) ՝ պատկերի/տեսանյութի ճանաչման հիմքը։ Ֆիլտրեր → եզրեր → ձևեր → օբյեկտներ։
Հաջորդականության մոդելներ՝ RNN-ներ և տրանսֆորմերներ ՝ տեքստի, խոսքի, սպիտակուցների, կոդի համար։ Տրանսֆորմերների ինքնագիտակցությունը խաղի կանոնները փոխող գործոն էր [3]:
Դիֆուզիոն մոդելներ ՝ գեներատիվ, պատահական աղմուկը քայլ առ քայլ վերածում են կոհերենտ պատկերների [4]:
Գրաֆիկական նեյրոնային ցանցեր (ԳՆՑ) - կառուցված ցանցերի և հարաբերությունների համար՝ մոլեկուլներ, սոցիալական գրաֆներ, խարդախության օղակներ։
Ուժեղացված ուսուցում (ՈՒՈՒ) - փորձի և սխալի գործակալներ, որոնք օպտիմալացնում են պարգևատրումը: Մտածեք ռոբոտաշինության, խաղերի, հաջորդական որոշումների մասին:
Հին հուսալի տվյալներ. kNN, Naive Bayes - արագ ելակետային գծեր, հատկապես տեքստի համար, երբ երեկ պատասխաններ էին պետք ։

Կողմնակի նշում. աղյուսակային տվյալների դեպքում մի՛ չափազանցեք բարդացնելը։ Լոգիստիկ ռեգրեսիան կամ ուժեղացված ծառերը հաճախ խորը ցանցեր են խփում։ Տրանսֆորմերները հիանալի են, պարզապես ոչ ամենուր։.

Ինչ տեսք ունի մարզումը ներսից 🔧

Ժամանակակից մոդելների մեծ մասը սովորում է՝ նվազագույնի հասցնելով կորստի ֆունկցիան գրադիենտային անկման որոշակի ձևի միջոցով : Հետադարձ տարածումը ուղղումները հետ է մղում, որպեսզի յուրաքանչյուր պարամետր իմանա, թե ինչպես շարժվել: Ավելացրեք հնարքներ, ինչպիսիք են վաղ կանգառը, կանոնավորումը կամ խելացի օպտիմիզատորները, որպեսզի այն չտարածվի քաոսի մեջ:

Իրականության ստուգումներ, որոնք արժե սոսնձել սեղանի վերևում

Տվյալների որակ > մոդելի ընտրություն։ Իսկապես։.
Միշտ ելակետային դիրքը զբաղեցնեք պարզ բանով։ Եթե գծային մոդելը ձախողվում է, ապա ձեր տվյալների հոսքը, հավանաբար, նույնպես ձախողվում է։.
Հետևեք վավերացմանը։ Եթե մարզումների կորուստը նվազում է, բայց վավերացման կորուստը աճում է, ապա բարև ձեզ, գերֆիթնես։.

Մոդելների գնահատում. ճշգրտությունը կայանում է 📏

Ճշգրտությունը լավ է հնչում, բայց դա սարսափելի մեկ թիվ է։ Կախված ձեր առաջադրանքից՝

Ճշգրտություն . երբ դուք դրական եք ասում, որքա՞ն հաճախ եք ճիշտ լինում։
Հիշե՛ք ՝ բոլոր իրական դրական կողմերից քանի՞սը գտաք։
F1 - հավասարակշռում է ճշգրտությունը և հիշելը։
PR կորերը , հատկապես անհավասարակշիռ տվյալների դեպքում, շատ ավելի անկեղծ են, քան ROC-ը [5]:

Բոնուս. ստուգեք կալիբրացիան (հավանականությունները որևէ բան նշանակո՞ւմ են) և շեղումը (ձեր մուտքային տվյալները շարժվո՞ւմ են ձեր ոտքերի տակ): Նույնիսկ «հիանալի» մոդելը հնանում է:.

Կառավարում, ռիսկ, ճանապարհի կանոններ 🧭

Երբ ձեր մոդելը շփվում է մարդկանց հետ, համապատասխանությունը կարևոր է։ Երկու կարևոր կետ՝

NIST-ի արհեստական բանականության RMF-ը կամավոր է, բայց գործնական, կյանքի ցիկլի քայլերով (կառավարում, քարտեզագրում, չափում, կառավարում) և վստահելիության շրջանակներով [1]:
ԵՄ արհեստական բանականության մասին օրենք - ռիսկի վրա հիմնված կարգավորում, որն արդեն իսկ օրենք է 2024 թվականի հուլիսից, սահմանում է խիստ պարտականություններ բարձր ռիսկի համակարգերի և նույնիսկ որոշ ընդհանուր նշանակության մոդելների համար [2]:

Գործնական եզրակացություն. փաստաթղթավորեք ձեր կառուցածը, ինչպես եք այն փորձարկել և ինչ ռիսկեր եք ստուգել: Խնայեք ձեզ կեսգիշերային արտակարգ իրավիճակների զանգերից հետո:.

Մոդել ընտրելը՝ առանց խելագարվելու 🧭➡️

Կրկնվող գործընթաց

Սահմանեք որոշումը ՝ ի՞նչ է լավ սխալը և ի՞նչը՝ վատ սխալը։
Աուդիտի տվյալներ ՝ չափս, հավասարակշռություն, մաքրություն։
Սահմանել սահմանափակումներ ՝ բացատրելիություն, լատենտություն, բյուջե։
Գործարկեք բազային գծերը ՝ սկսեք գծային/լոգիստիկ կամ փոքր ծառից։
Խելացիորեն կրկնեք ՝ ավելացրեք գործառույթներ, կարգավորեք, ապա փոխեք ընտանիքները, եթե աճը կայունանա։

Ձանձրալի է, բայց ձանձրալի լինելը լավ է այստեղ։.

Համեմատական պատկեր 📋

Մոդելի տեսակը	Լսարան	Գինու չափ	Ինչու է այն աշխատում
Գծային և լոգիստիկ	վերլուծաբաններ, գիտնականներ	ցածր-միջին	մեկնաբանելի, արագ, աղյուսակային հզորություն
Որոշումների ծառեր	խառը թիմեր	ցածր	մարդու համար ընթեռնելի բաժանումներ, ոչ գծային մշակում
Պատահական անտառ	արտադրանքի թիմեր	միջին	անսամբլները նվազեցնում են դիսպերսիան, ուժեղ գեներալիստները
Գրադիենտով ուժեղացված ծառեր	տվյալների գիտնականներ	միջին	SOTA աղյուսակային, ուժեղ՝ խառնաշփոթ հատկանիշներով
CNN-ներ	տեսլականի մարդիկ	միջին-բարձր	կոնվոլյուցիա → տարածական հիերարխիաներ
Տրանսֆորմերներ	NLP + մուլտիմոդալ	բարձր	ինքնակենտրոնացումը գեղեցիկ կերպով չափվում է [3]
Դիֆուզիոն մոդելներ	ստեղծագործական թիմեր	բարձր	աղմուկից ազատումը հանգեցնում է գեներատիվ մոգության [4]
GNN-ներ	գրաֆիկի սիրահարներ	միջին-բարձր	Հաղորդագրությունների փոխանցումը կոդավորում է հարաբերությունները
kNN / Նաիվ Բեյս	հաքերները շտապում են	շատ ցածր	պարզ բազային գծեր, ակնթարթային տեղակայում
Ուժեղացված ուսուցում	հետազոտություններով լի	միջին-բարձր	օպտիմալացնում է հաջորդական գործողությունները, բայց ավելի դժվար է զսպել

«Մասնագիտությունները» գործնականում 🧪

Պատկերներ → CNN-ները գերազանցում են տեղական օրինաչափությունները ավելի մեծ օրինաչափությունների մեջ կուտակելով։
Լեզու → Տրանսֆորմերները, ինքնագիտակցմամբ, կարողանում են հաղթահարել երկար համատեքստ [3]:
Գրաֆներ → GNN-ները փայլում են, երբ կապերը կարևոր են։
Գեներատիվ միջավայրեր → Դիֆուզիոն մոդելներ, փուլային աղմուկի հեռացում [4]:

Տվյալներ՝ լուռ MVP-ն 🧰

Մոդելները չեն կարող պահպանել վատ տվյալներ։ Հիմունքներ՝

Ճիշտ բաժանեք տվյալների հավաքածուները (արտահոսք չլինի, հարգեք ժամանակը):.
Անհավասարակշռության կառավարում (վերընտրանքային նմուշառում, կշիռներ, շեմեր):.
Ինժեների առանձնահատկությունները ուշադիր են. նույնիսկ խորը մոդելները օգուտ են քաղում։.
Խաչաձև վավերացում՝ բանականության համար։.

Հաջողության չափում՝ առանց ինքներդ ձեզ խաբելու 🎯

Համապատասխանեցրեք չափանիշները իրական ծախսերի հետ։ Օրինակ՝ աջակցության տոմսերի տեսակավորում։.

Հետկանչը բարձրացնում է շտապ տոմսով որսման մակարդակը։.
Ճշգրտությունը գործակալներին թույլ չի տալիս խեղդվել աղմուկի մեջ։.
F1-ը հավասարակշռում է երկուսն էլ։.
Հետևեք շեղմանը և կալիբրացմանը, որպեսզի համակարգը անձայն չփչանա։.

Ռիսկ, արդարություն, փաստաթղթեր՝ արեք դա շուտ 📝

Մտածեք փաստաթղթավորման մասին ոչ թե որպես բյուրոկրատական քաշքշուկի, այլ որպես ապահովագրության։ Կողմնակալության ստուգումներ, հուսալիության թեստեր, տվյալների աղբյուրներ՝ գրի առեք դրանք։ Արհեստական բանականության RMF [1] նման շրջանակները և ԵՄ Արհեստական բանականության մասին օրենքը [2] նման օրենքները միևնույն է դառնում են խաղադրույքի առարկա։.

Արագ մեկնարկի ճանապարհային քարտեզ 🚀

Հաստատեք որոշումը և չափանիշը։.
Հավաքեք մաքուր տվյալների հավաքածու։.
Գծային/ծառային բազային գիծ։.
Անցեք ճիշտ ընտանիքին մոդալի համար։.
Գնահատեք համապատասխան չափանիշներով։.
Փաստաթղթավորեք ռիսկերը առաքումից առաջ։.

Հաճախակի տրվող հարցեր կայծակի մասին ⚡

Սպասեք, և կրկին՝ ի՞նչ է արհեստական բանականության մոդելը։
Տվյալների վրա մարզված ֆունկցիա՝ մուտքային տվյալները ելքային տվյալներին համապատասխանեցնելու համար։ Կախարդանքը ընդհանրացումն է, այլ ոչ թե անգիր սովորելը։
Ավելի մեծ մոդելները միշտ հաղթո՞ւմ են։
Ոչ թե աղյուսակայինների դեպքում՝ ծառերը դեռևս գերիշխում են։ Տեքստի/պատկերների դեպքում, այո, չափը հաճախ օգնում է [3][4]:
Բացատրելիությունն ընդդեմ ճշգրտության՞։
Երբեմն փոխզիջում է։ Օգտագործեք հիբրիդային ռազմավարություններ։
Նուրբ կարգավորում, թե՞ արագ ինժեներական աշխատանք:
Կախված է՝ բյուջեն և առաջադրանքի շրջանակը թելադրում են: Երկուսն էլ իրենց տեղն ունեն:

TL;DR 🌯

Արհեստական բանականության մոդելները տվյալներից սովորող ֆունկցիաներ են։ Դրանք օգտակար են դարձնում ոչ միայն ճշգրտությունը, այլև վստահությունը, ռիսկերի կառավարումը և մտածված կիրառումը։ Սկսեք պարզից, չափեք կարևորը, փաստաթղթավորեք տգեղ մասերը, ապա (և միայն դրանից հետո) անցեք շքեղության։.

Եթե պահպանեք միայն մեկ նախադասություն. արհեստական բանականության մոդելները սովորած ֆունկցիաներ են, որոնք մարզվում են օպտիմալացման միջոցով, գնահատվում են համատեքստին հատուկ չափանիշներով և տեղակայված են պաշտպանիչ ցանկապատերի միջոցով։ Այսքանը։.

Հղումներ

NIST - Արհեստական բանականության ռիսկերի կառավարման շրջանակ (AI RMF 1.0)
NIST AI RMF 1.0 (PDF)
ԵՄ Արհեստական բանականության մասին օրենք - Պաշտոնական տեղեկագիր (2024/1689, 12 հուլիսի 2024թ.)
EUR-Lex: Արհեստական բանականության մասին օրենք (Պաշտոնական PDF)
Տրանսֆորմերներ / Ինքնաուշադրություն - Վասվանի և այլք, Ուշադրությունն այն ամենն է, ինչ ձեզ անհրաժեշտ է (2017):
arXiv:1706.03762 (PDF)
Դիֆուզիոն մոդելներ - Հո, Ջեյն, Աբբիլ, Աղմուկից ազատող դիֆուզիոն հավանականային մոդելներ (2020):
arXiv:2006.11239 (PDF)
Հանրային կապերն ընդդեմ Հռոմի պապի՝ անհավասարակշռության վերաբերյալ - Սաիտո և Ռեմսմայեր, PLOS ONE (2015):
DOI: 10.1371/journal.pone.0118432

Գտեք արհեստական բանականության վերջին նորույթները պաշտոնական արհեստական բանականության օգնականների խանութում

Մեր մասին

Վերադառնալ բլոգ

Ուրեմն… իրականում ի՞նչ են արհեստական ​​բանականության մոդելները։ 🧠