Ինչպե՞ս սովորել արհեստական ​​բանականությունը։

Ինչպե՞ս սովորել արհեստական ​​բանականությունը։

Արհեստական ​​բանականություն սովորելը կարող է նման լինել հսկայական գրադարան մտնելուն, որտեղ յուրաքանչյուր գիրք գոռում է «ՍԿՍԵՔ ԱՅՍՏԵՂԻՑ»։ Դարակների կեսին գրված է «մաթեմատիկա», ինչը… մի փոքր անքաղաքավարի է 😅

Դրական կողմն այն է, որ օգտակար բաներ կառուցելու համար ամեն ինչ իմանալու կարիք չկա։ Ձեզ անհրաժեշտ է խելամիտ ուղի, մի քանի հուսալի ռեսուրսներ և մի փոքր շփոթվելու պատրաստակամություն (շփոթությունը, ըստ էության, մուտքի վճարն է):

Հոդվածներ, որոնք կարող են ձեզ դուր գալ կարդալ սրանից հետո.

🔗 Ինչպե՞ս է արհեստական ​​բանականությունը հայտնաբերում անոմալիաները
Բացատրում է անոմալիաների հայտնաբերման մեթոդները՝ օգտագործելով մեքենայական ուսուցում և վիճակագրություն։

🔗 Ինչո՞ւ է արհեստական ​​բանականությունը վնասակար հասարակության համար
Ուսումնասիրում է արհեստական ​​բանականության էթիկական, սոցիալական և տնտեսական ռիսկերը։

🔗 Որքա՞ն ջուր է օգտագործում արհեստական ​​բանականությունը
Բնութագրում է արհեստական ​​ինտելեկտի էներգիայի սպառման և թաքնված ջրի օգտագործման ազդեցությունը։

🔗 Ի՞նչ է արհեստական ​​բանականության տվյալների հավաքածուն
Սահմանում է տվյալների հավաքածուները, պիտակավորումը և դրանց դերը արհեստական ​​բանականության մարզման մեջ։


Ի՞նչ է իրականում նշանակում «արհեստական ​​բանականություն» բառը առօրյա կյանքում 🤷♀️

Մարդիկ «AI» ասելով նկատի ունեն մի քանի տարբեր բաներ.

  • Մեքենայական ուսուցում (ՄՈՒ) – մոդելները տվյալներից սովորում են օրինաչափություններ՝ մուտքային տվյալները ելքային տվյալներին համապատասխանեցնելու համար (օրինակ՝ սպամի հայտնաբերում, գնի կանխատեսում): [1]

  • Խորը ուսուցում (ԽՈՒ) – մեքենայական ուսուցման ենթաբազմություն, որն օգտագործում է նեյրոնային ցանցեր մասշտաբով (տեսողություն, խոսք, մեծ լեզվական մոդելներ): [2]

  • Գեներատիվ արհեստական ​​բանականություն – մոդելներ, որոնք ստեղծում են տեքստ, պատկերներ, կոդ, աուդիո (չաթբոտներ, օգնականներ, բովանդակության գործիքներ): [2]

  • Ուժեղացված ուսուցում – ուսուցում փորձի և պարգևատրման միջոցով (խաղային գործակալներ, ռոբոտաշինություն): [1]

Սկզբում կատարյալ ընտրություն կատարելու կարիք չկա։ Պարզապես արհեստական ​​բանականությանը մի՛ վերաբերվեք որպես թանգարանի։ Այն ավելի շատ խոհանոցի է նման. ավելի արագ եք սովորում՝ պատրաստելով։ Երբեմն այրում եք տոստը։ 🍞🔥

Հակիրճ պատմություն. մի փոքր թիմ ուղարկեց «հիանալի» չեղարկման մոդել… մինչև որ նրանք նկատեցին նույնական ID-ներ մշակման և փորձարկման ժամանակ: Դասական արտահոսք: Պարզ խողովակաշար + մաքուր բաժանում կասկածելի 0.99-ը վերածեց վստահելի (ավելի ցածր!) գնահատականի և իրականում ընդհանրացված մոդելի: [3]


Ի՞նչն է դարձնում «Ինչպես սովորել արհեստական ​​բանականություն» ծրագիրը լավը ✅

Լավ պլանն ունի մի քանի առանձնահատկություններ, որոնք ձանձրալի են թվում, բայց ամիսներ են խնայում ձեզ համար.

  • Կառուցեք սովորելու ընթացքում (փոքր նախագծերը սկսեք սկզբում, ավելի մեծերը՝ ավելի ուշ):

  • Սովորեք անհրաժեշտ նվազագույն մաթեմատիկան , ապա շրջանագծեք՝ ավելի խորը հասկանալու համար։

  • Բացատրեք, թե ինչ եք արել (անտեսեք ձեր աշխատանքը. դա բուժում է մշուշոտ մտածողությունը):

  • Որոշ ժամանակ մնացեք մեկ «միջուկային կույտի» վրա (Python + Jupyter + scikit-learn → ապա PyTorch):

  • Չափեք առաջընթացը արդյունքներով , այլ ոչ թե դիտված ժամերով։

Եթե ​​ձեր ծրագիրը միայն տեսանյութեր և նշումներ են, դա նման է ջրի մասին կարդալով լողալու փորձի։


Ընտրեք ձեր երթուղին (առայժմ)՝ երեք տարածված արահետներ 🚦

Դուք կարող եք սովորել արհեստական ​​բանականությունը տարբեր «ձևերով»։ Ահա երեքը, որոնք աշխատում են.

1) Գործնական շինարարի ուղին 🛠️

Լավագույնն է, եթե ցանկանում եք արագ հաղթանակներ և մոտիվացիա։
Ուշադրության կենտրոնում են տվյալների հավաքածուները, ուսումնական մոդելները, առաքման ցուցադրությունները։
Սկզբնական ռեսուրսներ՝ Google-ի ML Crash Course, Kaggle Learn, fast.ai (հղումները ստորև նշված հղումներում և ռեսուրսներում են)։

2) Հիմունքները՝ առաջին հերթին 📚

Լավագույնն է, եթե սիրում եք պարզություն և տեսություն:
Ուշադրության կենտրոնում՝ ռեգրեսիա, կողմնակալություն-վարիացիա, հավանականային մտածողություն, օպտիմալացում:
Հիմնարարներ՝ Սթենֆորդի CS229 նյութեր, MIT-ի խորը ուսուցման ներածություն: [1][2]

3) Արհեստական ​​բանականության սերնդի հավելվածների մշակողի ուղին ✨

Լավագույնն է, եթե ցանկանում եք ստեղծել օգնականներ, որոնում, աշխատանքային հոսքեր, «գործակալի» նման բաներ։
Կենտրոնացում՝ հուշում, որոնում, գնահատումներ, գործիքների օգտագործում, անվտանգության հիմունքներ, տեղակայում։
Պահպանելու համար անհրաժեշտ փաստաթղթեր՝ հարթակի փաստաթղթեր (API), HF դասընթաց (գործիքավորում)։

Կարող եք գոտին փոխել ավելի ուշ։ Մեկնարկը դժվար մասն է։

 

Ինչպես սովորել արհեստական ​​բանականության ուսումնասիրությունը

Համեմատական ​​աղյուսակ՝ սովորելու լավագույն եղանակները (ազնիվ առանձնահատկություններով) 📋

Գործիք / Դասընթաց Լսարան Գինը Ինչու է այն աշխատում (կարճ ակնարկ)
Google մեքենայական ուսուցման արագացված դասընթաց սկսնակների Անվճար Տեսողական + գործնական; խուսափում է ավելորդ բարդություններից
Kaggle Learn (Ներածություն + Միջին մակարդակի մեքենայական ուսուցում) սկսնակներ, ովքեր սիրում են պրակտիկա Անվճար Փոքրիկ դասեր + ակնթարթային վարժություններ
fast.ai գործնական խորը ուսուցում շինարարներ որոշակի կոդավորմամբ Անվճար Դուք իրական մոդելներին մարզում եք վաղ, այսինքն՝ անմիջապես 😅
DeepLearning.AI ML մասնագիտացում կառուցվածքային սովորողներ Վճարված Հստակ առաջընթաց հիմնական ML հասկացությունների միջոցով
DeepLearning.AI խորը ուսուցման սպեցիֆիկացիա ML հիմունքներն արդեն իսկ Վճարված Նեյրոնային ցանցերի + աշխատանքային հոսքերի վրա ամուր խորություն
Սթենֆորդի CS229 նշումներ տեսության վրա հիմնված Անվճար Լուրջ հիմունքներ («ինչու՞ է սա աշխատում»)
scikit-learn օգտագործողի ուղեցույց ՄՄ մասնագետներ Անվճար Դասական գործիքակազմ աղյուսակային/բազային գծերի համար
PyTorch-ի ձեռնարկներ խորը ուսուցման կառուցողներ Անվճար Մաքուր ուղի թենզորներից → մարզման ցիկլեր [4]
«Գրկախառն դեմք» LLM դասընթաց NLP + LLM շինարարներ Անվճար Գործնական LLM աշխատանքային հոսք + էկոհամակարգի գործիքներ
NIST արհեստական ​​բանականության ռիսկերի կառավարման շրջանակ ցանկացած մեկը, ով կիրառում է արհեստական ​​բանականություն Անվճար Պարզ, օգտագործելի ռիսկերի/կառավարման կառուցվածք [5]

Փոքր նշում. առցանց «գինը» տարօրինակ է։ Որոշ բաներ անվճար են, բայց ուշադրություն են պահանջում… ինչը երբեմն ավելի վատ է։


Հիմնական հմտությունների հավաքածու, որը ձեզ իրականում անհրաժեշտ է (և ինչ հերթականությամբ) 🧩

Եթե ​​ձեր նպատակն է սովորել արհեստական ​​բանականություն ՝ առանց խեղդվելու, ձգտեք հետևյալ հաջորդականությանը.

  1. Python-ի հիմունքներ

  • Ֆունկցիաներ, ցուցակներ/թարգմանիչներ, թեթև դասեր, ֆայլերի ընթերցում։

  • Անպայման սովորություն՝ գրեք փոքրիկ սցենարներ, այլ ոչ թե պարզապես տետրեր։

  1. Տվյալների մշակում

  • NumPy-ի ոճի մտածողություն, պանդաների հիմունքներ, դավադրություններ կառուցել։

  • Դուք այստեղ շատ ժամանակ կանցկացնեք։ Ոչ թե շքեղ, բայց աշխատանքն է այդպիսին։

  1. Դասական մեքենայ ...

  • Գնացքի/փորձարկման ճեղքեր, արտահոսք, գերհարմարեցում։

  • Գծային/լոգիստիկ ռեգրեսիա, ծառեր, պատահական անտառներ, գրադիենտային ուժեղացում։

  • Չափանիշներ՝ ճշգրտություն, ճշգրտություն/հիշողություն, ROC-AUC, MAE/RMSE - իմանալ, թե երբ է յուրաքանչյուրը իմաստալից։ [3]

  1. Խորը ուսուցում

  • Տենզորներ, գրադիենտներ/հետին շարժում (կոնցեպտուալորեն), մարզման ցիկլեր։

  • CNN-ներ՝ պատկերների համար, տրանսֆորմերներ՝ տեքստի համար (ի վերջո):

  • PyTorch-ի մի քանի ամբողջական հիմունքներ շատ օգտակար են։ [4]

  1. Գեներատիվ արհեստական ​​բանականություն + իրավունքի կառավարման (LLM) աշխատանքային հոսքեր

  • Տոկենիզացիա, ներդրումներ, վերականգնման-ընդլայնված գեներացիա, գնահատում։

  • Նուրբ կարգավորում ընդդեմ հուշման (և երբ ձեզ ոչ մեկը պետք չէ):


Քայլ առ քայլ պլան, որին կարող եք հետևել 🗺️

Ա փուլ – արագ աշխատեցրեք ձեր առաջին մոդելը ⚡

Նպատակ՝ մարզել ինչ-որ բան, չափել այն, կատարելագործել այն։

  • Կատարեք կոմպակտ ներածական դասընթաց (օրինակ՝ մեքենայական ուսուցման արագացված դասընթաց), ապա՝ գործնական միկրոդասընթաց (օրինակ՝ Kaggle ներածություն):

  • Նախագծի գաղափար՝ կանխատեսել տների գները, հաճախորդների արտահոսքը կամ վարկային ռիսկը հանրային տվյալների բազայի վրա։

Փոքրիկ «հաղթանակների» ստուգաթերթիկ.

  • Դուք կարող եք բեռնել տվյալները։

  • Դուք կարող եք մարզել բազային մոդելը։

  • Դուք կարող եք բացատրել գերտեղավորումը պարզ լեզվով։

B փուլ՝ ծանոթացեք իրական մեքենայական ուսուցման պրակտիկային 🔧

Նպատակ՝ դադարեք զարմանալ տարածված ձախողումների եղանակներից։

  • Աշխատեք մեքենայական ուսուցման միջանկյալ թեմաների վրա՝ բացակայող արժեքներ, արտահոսք, խողովակաշարեր, CV։

  • Թերթեք scikit-learn օգտագործողի ուղեցույցի մի քանի բաժիններ և իրականում գործարկեք հատվածները։ [3]

  • Նախագծի գաղափար՝ պարզ ծայրից ծայր խողովակաշար՝ պահպանված մոդելով + գնահատման զեկույցով։

C փուլ՝ խորը ուսուցում, որը կախարդանքի տպավորություն չի թողնում 🧙♂️

Նպատակ՝ մարզել նեյրոնային ցանց և հասկանալ մարզման ցիկլը։

  • Կատարեք PyTorch-ի «Սովորեք հիմունքները» ուղին (տենզորներ → տվյալների հավաքածուներ/տվյալների բեռնիչներ → ուսուցում/գնահատում → պահպանում): [4]

  • Կարող եք նաև համակցել fast.ai-ի հետ, եթե ցանկանում եք արագություն և գործնական տպավորություններ։

  • Նախագծի գաղափար՝ պատկերի դասակարգիչ, տրամադրության մոդել կամ փոքր տրանսֆորմատորի նուրբ կարգավորում։

D փուլ՝ գեներատիվ արհեստական ​​բանականության հավելվածներ, որոնք իրականում աշխատում են ✨

Նպատակ՝ ստեղծել ինչ-որ բան, որը մարդիկ կօգտագործեն։

  • Հետևեք իրավագիտության մագիստրոսի գործնական դասընթացին + մատակարարի արագ մեկնարկային գործիքին՝ ներդրված ֆայլերը, վերականգնումը և անվտանգ գեներացիաները միացնելու համար։

  • Նախագծի գաղափար՝ հարց ու պատասխանի բոտ ձեր փաստաթղթերի վերաբերյալ (կտոր → ներդնել → վերցնել → պատասխանել հղումներով) կամ հաճախորդների սպասարկման օգնական՝ գործիքների կանչերով։


«Մաթեմատիկայի» մասը՝ սովորեք այն համեմունքի պես, ոչ թե ամբողջ ճաշատեսակի պես 🧂

Մաթեմատիկան կարևոր է, բայց ժամանակն ավելի կարևոր է։

Սկսելու համար նվազագույն կենսունակ մաթեմատիկա՝

  • Գծային հանրահաշիվ. վեկտորներ, մատրիցներ, կետային արտադրյալներ (ներդրումների ինտուիցիա): [2]

  • Հաշվարկ. ածանցյալի ինտուիցիա (թեքություններ → թեքություններ): [1]

  • Հավանականություն. բաշխումներ, սպասում, Բեյսի ոճի հիմնական մտածողություն։ [1]

Եթե ​​ավելի ուշ ավելի ֆորմալ հիմք եք ուզում, խորացեք CS229 նշումների վրա՝ հիմունքների համար, և MIT-ի ներածական խորը ուսուցման վրա՝ ժամանակակից թեմաների համար։ [1][2]


Նախագծեր, որոնք ձեզ այնպիսի տպավորություն են թողնում, կարծես գիտեք՝ ինչ եք անում 😄

Եթե ​​դասակարգիչները կառուցեք միայն խաղալիքների տվյալների բազաների վրա, կզգաք, որ փակուղու մեջ եք։ Փորձեք իրական աշխատանքի նմանվող նախագծեր։

  • Հիմնական գծից առաջնային ML նախագիծ (scikit-learn). մաքուր տվյալներ → ուժեղ հիմնական գծից → սխալների վերլուծություն: [3]

  • Իրավունքի մագիստրոսի աստիճան + վերականգնման հավելված. փաստաթղթերի ընդունում → կտոր → ներդնել → վերականգնել → մեջբերումներով պատասխաններ ստեղծել:

  • Մոդելի մոնիթորինգի մինի-վահանակ. գրանցում է մուտքային/ելքային տվյալները, հետևում է շեղվող ազդանշաններին (նույնիսկ պարզ վիճակագրությունն է օգնում):

  • Պատասխանատու արհեստական ​​բանականության մինի-աուդիտ. փաստաթղթավորեք ռիսկերը, ծայրահեղ դեպքերը, ձախողման հետևանքները. օգտագործեք թեթև շրջանակ: [5]


Պատասխանատու և գործնական տեղակայում (այո, նույնիսկ մենակ շինարարների համար) 🧯

Իրականության ստուգում. տպավորիչ ցուցադրությունները հեշտ են, հուսալի համակարգերը՝ ոչ։

  • Պահպանեք կարճ «մոդելային քարտի» ոճով README՝ տվյալների աղբյուրներ, չափանիշներ, հայտնի սահմաններ, թարմացման տեմպ։

  • Ավելացրեք հիմնական պաշտպանիչ ցանկապատեր (արագության սահմանափակումներ, մուտքագրման վավերացում, չարաշահման մոնիթորինգ):

  • Օգտատիրոջ հետ կապված կամ հետևանքային ցանկացած բանի համար օգտագործեք ռիսկի վրա հիմնված մոտեցում. նույնականացրեք վնասները, փորձարկեք ծայրահեղ դեպքերը և փաստաթղթավորեք մեղմացնող միջոցները: NIST AI RMF-ը կառուցված է հենց դրա համար: [5]


Հաճախ հանդիպող թակարդներ (որպեսզի կարողանաք խուսափել դրանցից) 🧨

  • Ուսուցողական դասընթացներից դասընթաց անցնելը ՝ «ևս մեկ դասընթաց» գործառույթը դառնում է ձեր ամբողջ անհատականությունը։

  • Սկսենք ամենադժվար թեմայից ՝ տրանսֆորմերները լավն են, բայց ամենապարզ մոդելները վարձ են վճարում։

  • Գնահատման անտեսում . միայն ճշգրտությունը կարող է լինել անկեղծ։ Օգտագործեք աշխատանքի համար ճիշտ չափանիշը։ [3]

  • Մի՛ գրի առեք բաները ՝ կարճ նշումներ կատարեք՝ ինչն է ձախողվել, ինչն է փոխվել, ինչն է բարելավվել։

  • Տեղակայման պրակտիկա չկա . նույնիսկ պարզ հավելվածի փաթաթանը շատ բան է սովորեցնում։

  • Ռիսկի մասին մտածելուց խուսափելը . առաքումից առաջ գրեք երկու կետ հնարավոր վնասների մասին: [5]


Վերջնական դիտողություններ – Շատ երկար է, չեմ կարդացել 😌

Եթե ​​հարցնում եք ՝ ինչպես սովորել արհեստական ​​բանականություն , ահա ամենապարզ հաղթական բաղադրատոմսը.

  • Սկսեք մեքենայական ուսուցման գործնական հիմունքներից (կոմպակտ ներածություն + Kaggle ոճի պրակտիկա):

  • Օգտագործեք scikit-learn-ը՝ իրական մեքենայական ուսուցման աշխատանքային հոսքեր և չափանիշներ սովորելու համար։ [3]

  • Խորը ուսուցման և մարզումների ցիկլերի համար անցեք PyTorch

  • Ավելացրեք LLM հմտություններ գործնական դասընթացի և API արագ մեկնարկների միջոցով։

  • Կառուցեք 3-5 նախագիծ , որոնք կցուցադրեն՝ տվյալների նախապատրաստում, մոդելավորում, գնահատում և պարզ «արտադրանքի» փաթեթավորում։

  • Ռիսկերը/կառավարումը դիտարկեք որպես «կատարվածի» մաս, այլ ոչ թե որպես լրացուցիչ բաղադրիչ։ [5]

Եվ այո, երբեմն կզգաք ձեզ կորած։ Դա նորմալ է։ Արհեստական ​​բանականությունը նման է տոստերին կարդալ սովորեցնելուն. այն տպավորիչ է, երբ աշխատում է, մի փոքր սարսափելի, երբ չի աշխատում, և պահանջում է ավելի շատ կրկնություններ, քան որևէ մեկը խոստովանում է 😵💫


Հղումներ

[1] Սթենֆորդի CS229 դասախոսությունների նշումներ։ (ՄՄ հիմնական հիմունքներ, վերահսկվող ուսուցում, հավանականային կառուցվածք)։
https://cs229.stanford.edu/main_notes.pdf

[2] MIT 6.S191: Ներածություն խորը ուսուցմանը: (Խորը ուսուցման ակնարկ, ժամանակակից թեմաներ, այդ թվում՝ իրավաբանության մագիստրոսներ):
https://introtodeeplearning.com/

[3] scikit-learn: Մոդելի գնահատում և չափանիշներ: (Ճշգրտություն, ճշգրտություն/հիշողություն, ROC-AUC և այլն):
https://scikit-learn.org/stable/modules/model_evaluation.html

[4] PyTorch-ի ձեռնարկներ – Սովորեք հիմունքները։ (Տենզորներ, տվյալների հավաքածուներ/տվյալների բեռնիչներ, մարզման/գնահատման ցիկլեր)։
https://docs.pytorch.org/tutorials/beginner/basics/intro.html

[5] NIST արհեստական ​​բանականության ռիսկերի կառավարման շրջանակ (AI RMF 1.0): (Ռիսկի վրա հիմնված, վստահելի արհեստական ​​բանականության ուղեցույց):
https://nvlpubs.nist.gov/nistpubs/ai/nist.ai.100-1.pdf


Լրացուցիչ ռեսուրսներ (սեղմելի)

Գտեք արհեստական ​​բանականության վերջին նորույթները պաշտոնական արհեստական ​​բանականության օգնականների խանութում

Մեր մասին

Վերադառնալ բլոգ