ինչպես ուսումնասիրել արհեստական ​​բանականությունը

Ինչպե՞ս ուսումնասիրել արհեստական ​​բանականությունը։

Արհեստական ​​բանականությունը թվում է հսկայական և մի փոքր խորհրդավոր։ Լավ նորություն. իրական առաջընթացի համար ձեզ պետք չեն գաղտնի մաթեմատիկական կարողություններ կամ գրաֆիկական պրոցեսորներով լի լաբորատորիա։ Եթե հետաքրքրվել եք, թե ինչպես ուսումնասիրել արհեստական ​​բանականությունը , այս ուղեցույցը ձեզ հստակ ուղի է տալիս զրոյից մինչև պորտֆոլիոյի համար պատրաստ նախագծերի ստեղծումը։ Եվ այո, մենք կներկայացնենք ռեսուրսներ, ուսումնասիրության մարտավարություն և մի քանի դժվարությամբ ձեռք բերված կարճ ճանապարհներ։ Սկսենք։

🔗 Ինչպե՞ս է արհեստական ​​բանականությունը սովորում
Մեքենաներին սովորեցնող ալգորիթմների, տվյալների և հետադարձ կապի ակնարկ։

🔗 Արհեստական ​​բանականության լավագույն գործիքներ՝ ամեն ինչ ավելի արագ տիրապետելու համար
Ընտրված հավելվածներ՝ ուսումը, պրակտիկան և հմտությունների կատարելագործումը արագացնելու համար։

🔗 Լեզուների ուսուցման լավագույն արհեստական ​​բանականության գործիքները
Հավելվածներ, որոնք անհատականացնում են բառապաշարը, քերականությունը, խոսքը և ըմբռնման վարժությունները։

🔗 Բարձրագույն արհեստական ​​բանականության գործիքներ բարձրագույն կրթության, ուսուցման և կառավարման համար
Դասավանդմանը, գնահատմանը, վերլուծությանը և համալսարանի գործունեության արդյունավետությանը աջակցող հարթակներ։


Ինչպես ուսումնասիրել արհեստական ​​բանականությունը

Լավ ուսումնական պլանը նման է ամուր գործիքների արկղի, այլ ոչ թե պատահական աղբարկղի։ Այն պետք է.

  • Հաջորդականության հմտություններ , որպեսզի յուրաքանչյուր նոր բլոկ կոկիկ տեղավորվի վերջինում։

  • Առաջնահերթությունը տվեք պրակտիկային , երկրորդը՝ տեսությանը, բայց երբեք մի՛ արա դա ։

  • Հիմնվեք իրական նախագծերի վրա, որոնք կարող եք ցույց տալ իրական մարդկանց։

  • Օգտագործեք հեղինակավոր աղբյուրներ , որոնք ձեզ չեն սովորեցնի փխրուն սովորություններ։

  • Հարմարեցրեք ձեր կյանքը փոքր, կրկնվող ռեժիմներով։

  • Եղեք ազնիվ հետադարձ կապի, չափանիշների և կոդի վերանայումների հարցում։

Եթե ​​ձեր ծրագիրը ձեզ սրանք չի տալիս, ապա դրանք պարզապես դրական ազդեցություն են թողնում։ Հզոր հիմքեր, որոնք մշտապես ապահովում են արդյունքներ. Սթենֆորդի CS229/CS231n-ը՝ հիմունքների և տեսլականի համար, MIT-ի գծային հանրահաշիվը և խորը ուսուցման ներածությունը, fast.ai-ն՝ գործնական արագության համար, Hugging Face-ի LLM դասընթացը՝ ժամանակակից NLP/տրանսֆորմերների համար, և OpenAI Cookbook-ը՝ գործնական API օրինաչափությունների համար [1–5]:


Կարճ պատասխան՝ ինչպես ուսումնասիրել արհեստական ​​բանականության ուղեցույցը 🗺️

  1. Սովորեք Python + նոթբուքեր բավականաչափ, որպեսզի վտանգավոր լինեք։

  2. Թարմացրեք մաթեմատիկայի հիմնական գիտելիքները ՝ գծային հանրահաշիվ, հավանականություն, օպտիմալացման հիմունքներ։

  3. Կատարեք փոքր ML նախագծեր ամբողջ ծավալով՝ տվյալներ, մոդել, չափանիշներ, իտերացիա։

  4. Բարձրացրեք մակարդակը խորը ուսուցման միջոցով ՝ CNN-ներ, տրանսֆորմերներ, մարզման դինամիկա։

  5. Ընտրեք ուղղություն ՝ տեսլական, NLP, խորհրդատվական համակարգեր, գործակալներ, ժամանակային շարքեր։

  6. Ուղարկեք պորտֆոլիոյի նախագծերը մաքուր պահոցներով, README-ներով և դեմո տարբերակներով։

  7. Կարդացեք աշխատանքները ծույլ-խելացի ձևով և կրկնօրինակեք փոքր արդյունքները։

  8. Պահպանեք ուսուցման ցիկլը ՝ գնահատեք, վերաձևակերպեք, փաստաթղթավորեք, կիսվեք։

Մաթեմատիկայի համար MIT-ի գծային հանրահաշիվը ամուր հիմք է, իսկ Գուդֆելոու-Բենջիո-Կուրվիլի տեքստը՝ հուսալի հղում, երբ դուք խրված եք հետադարձ կապի, կանոնավորման կամ օպտիմալացման նրբերանգների մեջ [2, 5]:


Հմտությունների ստուգաթերթիկ, նախքան չափազանց խորը մտնելը 🧰

  • Python ՝ ֆունկցիաներ, դասեր, ցուցակների/դիկտների համեմատություններ, վիրտուալ միջավայրեր, հիմնական թեստեր։

  • Տվյալների մշակում ՝ պանդաներ, NumPy, գծապատկերների կառուցում, պարզ էլեկտրոնային ադապտացիա։

  • Իրականում դուք կօգտագործեք մաթեմատիկա ՝ վեկտորներ, մատրիցներ, սեփական ինտուիցիա, գրադիենտներ, հավանականության բաշխումներ, խաչաձև էնտրոպիա, կանոնավորում։

  • Գործիքավորում ՝ Git, GitHub-ի հետ կապված խնդիրներ, Jupyter, GPU նոթբուքեր, ձեր գործողությունների գրանցում։

  • Մտածելակերպ ՝ երկու անգամ չափիր, մեկ անգամ ուղարկիր, ընդունիր տգեղ նախագծերը, նախ շտկիր տվյալները։

Արագ հաղթանակներ. fast.ai-ի վերևից ներքև մոտեցումը թույլ է տալիս վաղ փուլում մարզել օգտակար մոդելներ, մինչդեռ Քագլի կարճ դասերը զարգացնում են մկանային հիշողությունը պանդաների և բազային գծերի համար [3]:


Համեմատական ​​աղյուսակ. Արհեստական ​​բանականության ուսումնասիրման ուղիներ 📊

Փոքրիկ առանձնահատկություններ էլ կան, քանի որ իրական սեղանները հազվադեպ են կատարյալ կոկիկ լինում։

Գործիք / Դասընթաց Լավագույնը Գինը Ինչու է այն աշխատում / Նշումներ
Սթենֆորդ CS229 / CS231n Հաստատուն տեսություն + տեսողության խորություն Անվճար Մաքրել մեքենայական ուսուցման հիմունքները + CNN-ի վերապատրաստման մանրամասները, զուգակցել նախագծերի հետ ավելի ուշ [1]:
MIT DL ներածություն + 18.06 Հասկացությունից մինչև գործնական կամուրջ Անվճար Համառոտ հեռավար ուսուցման դասախոսություններ + խիստ գծային հանրահաշիվ, որը համապատասխանում է ներդրված տվյալներին և այլն [2]:
fast.ai Գործնական DL Հաքերներ, ովքեր սովորում են գործելով Անվճար Նախագծերը՝ նախևառաջ, նվազագույն մաթեմատիկա մինչև անհրաժեշտության դեպքում. շատ մոտիվացնող հետադարձ կապի ցիկլեր [3]:
«Գրկախառն դեմք» LLM դասընթաց Տրանսֆորմերներ + ժամանակակից NLP կույտ Անվճար Դասավանդում է տոկենիզատորներ, տվյալների հավաքածուներ, Hub; գործնական ճշգրտման/եզրակացության աշխատանքային հոսքեր [4]:
OpenAI խոհարարական գիրք Շինարարներ, որոնք օգտագործում են հիմքի մոդելներ Անվճար Արտադրական առաջադրանքների և պաշտպանիչ ցանկապատերի համար աշխատեցվող բաղադրատոմսեր և մոդելներ [5]:

Խորը ուսումնասիրություն 1։ Առաջին ամիսը - Նախագծեր կատարելության փոխարեն 🧪

Սկսեք երկու փոքր նախագծերից։ Իսկապես փոքր։

  • Աղյուսակային բազային գիծ . բեռնել հանրային տվյալների բազմություն, բաժանել գնացքը/փորձարկումը, համապատասխանեցնել լոգիստիկ ռեգրեսիան կամ փոքր ծառը, հետևել չափանիշներին, գրել ձախողվածները։

  • Տեքստային կամ պատկերային խաղալիք . տվյալների փոքր մասի վրա ճշգրտեք նախապես պատրաստված փոքր մոդելը: Փաստաթղթավորեք նախնական մշակումը, վերապատրաստման ժամանակը և փոխզիջումները:

Ինչո՞ւ սկսել այսպես։ Վաղ հաղթանակները ստեղծում են իմպուլս։ Դուք կսովորեք աշխատանքային հոսքի սոսինձը՝ տվյալների մաքրում, գործառույթների ընտրություն, գնահատում և իտերացիա։ fast.ai-ի վերևից ներքև դասերը և Քագլի կառուցվածքային տետրերը հենց այս «նախ առաքիր, հետո ավելի խորը հասկացիր» ռիթմն են ամրապնդում [3]:

Մինի-դեպք (2 շաբաթ, աշխատանքից հետո). Կրտսեր վերլուծաբանը 1-ին շաբաթում կառուցեց արտահոսքի բազային գիծ (լոգիստիկ ռեգրեսիա), ապա 2-րդ շաբաթում փոխարինեց կանոնավորացմամբ և ավելի լավ հատկանիշներով: Մոդել AUC +7 միավոր՝ հատկանիշների կրճատման մեկ կեսօրով. նրբագեղ ճարտարապետություններ անհրաժեշտ չեն:


Խորը ուսումնասիրություն 2։ Մաթեմատիկա առանց արցունքների - Պարզապես բավարար տեսություն 📐

Հզոր համակարգեր կառուցելու համար ձեզ անհրաժեշտ չէ յուրաքանչյուր թեորեմ։ Ձեզ անհրաժեշտ են այն մասերը, որոնք ազդում են որոշումների վրա։

  • Գծային հանրահաշիվ ներդրման, ուշադրության և օպտիմալացման երկրաչափության համար։

  • Անորոշության, խաչաձև էնտրոպիայի, կալիբրացման և պրիորների հավանականություն

  • Ուսումնական տեմպերի, կանոնավորման և այն պատճառների օպտիմալացման

MIT 18.06-ը ներկայացնում է կիրառական մոտեցումը։ Եթե ցանկանում եք խորը ցանցերում ավելի խորը հասկացողություն գտնել, ապա խորը ուսուցման դասագիրքը օգտագործեք որպես հղում, այլ ոչ թե որպես վեպ [2, 5]:

Միկրոսովորություն. օրական առավելագույնը 20 րոպե մաթեմատիկա։ Հետո վերադարձ ծրագրավորմանը։ Տեսությունն ավելի լավ է ընկալվում, երբ խնդիրը գործնականում եք լուծում։


Խորը ուսումնասիրություն 3. Ժամանակակից NLP և LLM - Տրանսֆորմերի շրջադարձը 💬

Այսօր տեքստային համակարգերի մեծ մասը հենվում է տրանսֆորմատորների վրա: Արդյունավետորեն գործելու համար՝

  • Աշխատեք «Hugging Face» իրավունքի կառավարման դասընթացի վրա՝ տոկենիզացիա, տվյալների հավաքածուներ, Hub, նուրբ կարգավորում, եզրակացություն։

  • Ուղարկեք գործնական ցուցադրական տարբերակ. ձեր նշումների վերականգնման միջոցով ընդլայնված որակի ապահովում, փոքր մոդելի միջոցով տրամադրության վերլուծություն կամ թեթև ամփոփիչ։

  • Հետևեք կարևորին՝ լատենտությանը, արժեքին, ճշգրտությանը և օգտատիրոջ կարիքներին համապատասխանությանը։

HF դասընթացը պրագմատիկ է և էկոհամակարգի նկատմամբ զգայուն, ինչը խնայում է գործիքների ընտրության հարցում անհարմարությունները [4]: ​​API-ի կոնկրետ ձևանմուշների և պաշտպանիչ ցանկապատերի (հուշումների, գնահատման կառուցվածքների) համար OpenAI Cookbook-ը լի է գործարկելի օրինակներով [5]:


Խորը ուսումնասիրություն 4. Տեսողության հիմունքներ՝ առանց պիքսելներում խեղդվելու 👁️

Տեսլականի՞ տեր եք։ Համատեղեք CS231n դասախոսությունները փոքր նախագծի հետ. դասակարգեք հատուկ տվյալների բազմությունը կամ ճշգրտեք նախապես պատրաստված մոդելը որոշակի նիշային կատեգորիայի համար։ Կենտրոնացեք տվյալների որակի, լրացման և գնահատման վրա՝ նախքան էկզոտիկ ճարտարապետություններ փնտրելը։ CS231n-ը հուսալի հյուսիսային աստղ է այն բանի համար, թե ինչպես են իրականում աշխատում կոնվերսիաները, մնացորդները և վերապատրաստման հևրիստիկաները [1]:


Հետազոտություն կարդալ առանց աչքերը շեղելու 📄

Աշխատող ցիկլ.

  1. կարդացեք ամփոփումը և նկարները ։

  2. Թերթեք մեթոդի հավասարումները՝ մասերը անվանելու համար։

  3. Անցնել փորձերին և սահմանափակումներին ։

  4. Վերարտադրեք միկրոարդյունք խաղալիքների տվյալների հավաքածուի վրա։

  5. Գրեք երկու պարբերությունից բաղկացած ամփոփում՝ նշելով մեկ հարց, որը դեռ ունեք։

Իրականացումներ կամ բազային գծեր գտնելու համար, նախքան պատահական բլոգներ փնտրելը, ստուգեք վերը նշված աղբյուրներին կապված դասընթացների պահոցները և պաշտոնական գրադարանները [1–5]:

Փոքրիկ խոստովանություն. երբեմն ես նախ կարդում եմ եզրակացությունը։ Ուղղափառ չէ, բայց այն օգնում է որոշել, թե արդյոք շեղումը արժե այդ գնին։


Կառուցեք ձեր անձնական արհեստական ​​բանականության հավաքածուն 🧱

  • Տվյալների աշխատանքային հոսքեր . pandas՝ վիճաբանության համար, scikit-learn՝ բազային գծերի համար։

  • Հետևում . պարզ աղյուսակը կամ թեթև փորձերի հետևորդը հարմար են։

  • Մատուցում . սկսելու համար բավական է փոքրիկ FastAPI հավելվածը կամ նոթբուքի դեմո տարբերակը։

  • Գնահատում ՝ հստակ չափանիշներ, աբլյացիաներ, առողջական վիճակի ստուգումներ, խուսափեք անաչառ ընտրությունից։

fast.ai-ն ու Kaggle-ը թերագնահատված են հիմունքների վրա արագություն կառուցելու և ձեզ հետադարձ կապի միջոցով արագ իտերացիաներ կատարելու հարկադրելու համար [3]:


Պորտֆոլիո նախագծեր, որոնք կուրախացնեն գործատուներին 👍

Ձգտեք ստեղծել երեք նախագիծ, որոնցից յուրաքանչյուրը կցուցաբերի տարբեր ուժեղ կողմեր.

  1. Դասական մեքենայական ուսուցման հիմք . ուժեղ էլեկտրոնային վերլուծության վերլուծություն, առանձնահատկություններ և սխալների վերլուծություն։

  2. Խորը ուսուցման հավելված ՝ պատկերով կամ տեքստով, նվազագույն վեբ ցուցադրությամբ։

  3. Իրավագիտության բակալավրիատի վրա հիմնված գործիք ՝ տվյալների վերականգնման ընդլայնված չատբոտ կամ գնահատող, որն ունի արագ և տվյալների հիգիենայի հստակ փաստաթղթավորում։

Օգտագործեք README-ներ՝ խնդրի հստակ ձևակերպմամբ, կարգավորման քայլերով, տվյալների քարտերով, գնահատման աղյուսակներով և կարճ էկրանային հեռարձակմամբ: Ավելի լավ է, եթե կարողանաք համեմատել ձեր մոդելը պարզ բազային գծի հետ: Խոհարարական գրքերի կաղապարները օգնում են, երբ ձեր նախագիծը ներառում է գեներատիվ մոդելներ կամ գործիքների օգտագործում [5]:


Ուսումնական սովորություններ, որոնք կանխում են գերհոգնածությունը ⏱️

  • Պոմոդորո զույգեր ՝ 25 րոպե կոդավորում, 5 րոպե փոփոխության փաստաթղթավորում։

  • Կոդի օրագիր . գրեք փոքրիկ հետմահու գնահատականներ անհաջող փորձերից հետո։

  • Միտումնավոր վարժություն . մեկուսացրեք հմտությունները (օրինակ՝ շաբաթական երեք տարբեր տվյալների բեռնում):

  • Համայնքի արձագանք . կիսվեք շաբաթական թարմացումներով, խնդրեք կոդի ակնարկներ, փոխանակեք մեկ խորհուրդ մեկ քննադատության դիմաց։

  • Վերականգնում . այո՛, հանգիստը հմտություն է. ձեր ապագա «ես»-ը քնից հետո ավելի լավ կոդ է գրում։

Մոտիվացիայի տատանումներ։ Փոքր հաղթանակներն ու տեսանելի առաջընթացը կապող օղակն են։


Dodge-ի հաճախ հանդիպող թերությունները 🧯

  • Մաթեմատիկայի հետաձգում . ապացույցների շարունակական թերթում՝ տվյալների բազմությանը դիպչելուց առաջ։

  • Անվերջանալի ձեռնարկներ ՝ դիտեք 20 տեսանյութ, ոչինչ մի՛ կառուցեք։

  • Փայլուն մոդելի համախտանիշ . ճարտարապետությունների փոխարինում՝ տվյալների կամ կորստի շտկման փոխարեն։

  • Գնահատման պլան չկա . եթե չեք կարող ասել, թե ինչպես եք չափելու հաջողությունը, ապա չեք կարողանա։

  • Լաբորատորիաների պատճեն-տեղադրում . շարունակեք տպել, հաջորդ շաբաթ մոռացեք ամեն ինչ։

  • Գերհղկված պահոցներ . կատարյալ README, առանց փորձերի։ Վա՜յ։

Երբ ձեզ անհրաժեշտ է կառուցվածքային, հեղինակավոր նյութ վերակարգավորման համար, CS229/CS231n-ը և MIT-ի առաջարկները հուսալի վերագործարկման կոճակ են [1–2]:


Հղումների դարակ, որը դուք կրկին կայցելեք 📚

  • Գուդֆելոու, Բենջիո, Կուրվիլ - Խորը ուսուցում . հետադարձ կապի, կանոնավորման, օպտիմալացման և ճարտարապետությունների ստանդարտ հղումներ [5]:

  • MIT 18.06 . մատրիցների և վեկտորային տարածությունների ամենամաքուր ներածությունը մասնագետների համար [2]:

  • CS229/CS231n նշումներ ՝ գործնական մեքենայական ուսուցման տեսություն + տեսողության մարզման մանրամասներ, որոնք բացատրում են, թե ինչու են լռելյայն արժեքները աշխատում [1]:

  • «Գրկախառն դեմք» իրավունքի մագիստրոսական դասընթաց . տոկենիզատորներ, տվյալների հավաքածուներ, տրանսֆորմատորների նուրբ կարգավորում, Hub աշխատանքային հոսքեր [4]:

  • fast.ai + Kaggle ՝ արագ վարժական ցիկլեր, որոնք խրախուսում են առաքումը դանդաղեցման փոխարեն [3]:


6 շաբաթվա մեղմ ծրագիր՝ ամեն ինչ սկսելու համար 🗓️

Ոչ թե կանոնների գիրք, այլ ավելի շուտ ճկուն բաղադրատոմս։

Շաբաթ 1՝
Python-ի կատարելագործում, պանդաների վարժություն, վիզուալիզացիաներ։ Մինի-նախագիծ՝ կանխատեսեք ինչ-որ աննշան բան, գրեք 1 էջանոց զեկույց։

Շաբաթ 2՝
Գծային հանրահաշվի թարմացում, վեկտորացման վարժություններ։ Վերամշակեք ձեր մինի-նախագիծը՝ ավելի լավ հնարավորություններով և ավելի ուժեղ բազային գծով [2]:

Շաբաթ 3
՝ Գործնական մոդուլներ (կարճ, կենտրոնացված): Ավելացնել խաչաձև վավերացման, շփոթության մատրիցներ, տրամաչափման գրաֆիկներ:

Շաբաթ 4,
fast.ai դասեր 1–2; ուղարկեք փոքր պատկերի կամ տեքստի դասակարգիչ [3]: Փաստաթղթավորեք ձեր տվյալների խողովակաշարը այնպես, կարծես թիմակիցը հետագայում այն ​​կկարդա:

5-րդ շաբաթ՝
«Hugging Face» LLM դասընթացի արագ անցում. փոքր կորպուսի վրա իրականացնել RAG-ի փոքրիկ ցուցադրություն: Չափել լատենտությունը/որակը/արժեքը, ապա օպտիմալացնել մեկը [4]:

Շաբաթ 6
Գրեք մեկ էջանոց աշխատանք՝ համեմատելով ձեր մոդելները պարզ բազային գծերի հետ: Լրացրեք պահոցը, ձայնագրեք կարճ ցուցադրական տեսանյութ, կիսվեք՝ արձագանք ստանալու համար: Այստեղ կօգնեն խոհարարական գրքերի նախշերը [5]:


Վերջնական դիտողություններ - Շատ երկար է, չեմ կարդացել 🎯

Արհեստական ​​բանականությունը լավ ուսումնասիրելու եղանակը տարօրինակ պարզ է. կատարեք փոքր նախագծեր, սովորեք բավարար քանակությամբ մաթեմատիկա և հենվեք վստահելի դասընթացների և խոհարարական գրքերի վրա, որպեսզի չվերափոխեք անիվները քառակուսի անկյուններով: Ընտրեք մի ուղի, կառուցեք պորտֆոլիո՝ օգտագործելով անկեղծ գնահատականներ և շարունակեք կրկնել պրակտիկա-տեսություն-պրակտիկա: Պատկերացրեք դա նման մի քանի սուր դանակներով և տաք տապակով եփել սովորելուն՝ ոչ թե բոլոր սարքերով, այլ միայն նրանցով, որոնք ընթրիք են ապահովում սեղանին: Դուք սա հասկացաք: 🌟


Հղումներ

[1] Սթենֆորդ CS229 / CS231n - Մեքենայական ուսուցում; Խորը ուսուցում համակարգչային տեսողության համար։

[2] MIT - Գծային հանրահաշիվ (18.06) և Խորը ուսուցման ներածություն (6.S191):

[3] Գործնական պրակտիկա - fast.ai և Kaggle Learn:

[4] Տրանսֆորմերներ և ժամանակակից NLP - Դեմքի գրկախառնության իրավունքի մագիստրոսական դասընթաց։

[5] Խորը ուսուցման հղումներ + API ձևանմուշներ - Գուդֆելոու և այլք; OpenAI խոհարարական գիրք։

Գտեք արհեստական ​​բանականության վերջին նորույթները պաշտոնական արհեստական ​​բանականության օգնականների խանութում

Մեր մասին

Վերադառնալ բլոգ