Ի՞նչ է բաց կոդով արհեստական ​​բանականությունը

Ի՞նչ է բաց կոդով արհեստական ​​բանականությունը։

Բաց կոդով արհեստական ​​բանականության մասին խոսում են այնպես, կարծես այն կախարդական բանալի լինի, որը ամեն ինչ բացում է։ Այդպես չէ։ Սակայն դա գործնական , թույլտվություն չպահանջող միջոց է արհեստական ​​բանականության համակարգեր կառուցելու համար, որոնք կարող եք հասկանալ, կատարելագործել և առաքել՝ առանց վաճառողին խնդրելու, որ միացնի անջատիչը։ Եթե մտածել եք, թե ինչն է համարվում «բաց», ինչն է պարզապես մարքեթինգը և ինչպես այն իրականում օգտագործել աշխատանքի վայրում, ապա ճիշտ տեղում եք։ Վերցրեք մի բաժակ սուրճ՝ սա օգտակար կլինի, և գուցե մի փոքր կարծիքային ☕🙂։

Հոդվածներ, որոնք կարող են ձեզ դուր գալ կարդալ սրանից հետո.

🔗 Ինչպես ներառել արհեստական ​​բանականությունը ձեր բիզնեսում
Գործնական քայլեր՝ արհեստական ​​բանականության գործիքները ինտեգրելու համար՝ բիզնեսի ավելի խելացի աճի համար։

🔗 Ինչպես օգտագործել արհեստական ​​բանականությունը՝ ավելի արդյունավետ լինելու համար
Բացահայտեք արդյունավետ արհեստական ​​բանականության աշխատանքային հոսքեր, որոնք խնայում են ժամանակ և բարձրացնում արդյունավետությունը։

🔗 Ի՞նչ են արհեստական ​​բանականության հմտությունները
Սովորեք ապագային պատրաստ մասնագետների համար անհրաժեշտ արհեստական ​​բանականության հիմնական կարողությունները։

🔗 Ի՞նչ է Google Vertex AI-ը
Հասկացեք Google-ի Vertex արհեստական ​​բանականությունը և թե ինչպես է այն արդյունավետացնում մեքենայական ուսուցումը։


Ի՞նչ է բաց կոդով արհեստական ​​բանականությունը։ 🤖🔓

Ամենապարզ ձևով՝ բաց կոդով արհեստական ​​բանականությունը նշանակում է, որ արհեստական ​​բանականության համակարգի բաղադրիչները՝ կոդը, մոդելի կշիռները, տվյալների փոխանցման խողովակները, ուսումնական սկրիպտները և փաստաթղթերը, թողարկվում են լիցենզիաներով, որոնք թույլ են տալիս յուրաքանչյուրին օգտագործել, ուսումնասիրել, փոփոխել և կիսվել դրանցով՝ ենթակա լինելով ողջամիտ պայմանների: Այդ հիմնական ազատության լեզուն բխում է բաց կոդի սահմանումից և դրա օգտագործողի ազատության վաղեմի սկզբունքներից [1]: Արհեստական ​​բանականության հետ կապված խնդիրն այն է, որ կան ավելի շատ բաղադրիչներ, քան պարզապես կոդ:

Որոշ նախագծեր հրապարակում են ամեն ինչ՝ կոդ, մարզման տվյալների աղբյուրներ, բաղադրատոմսեր և մարզված մոդել: Մյուսները հրապարակում են միայն կշիռները ՝ հատուկ լիցենզիայով: Էկոհամակարգը երբեմն օգտագործում է անփույթ հակիրճ թարգմանություն, այնպես որ եկեք այն կարգի բերենք հաջորդ բաժնում:


Բաց կոդով արհեստական ​​բանականություն vs բաց կշիռներ vs բաց մուտք 😅

Սա այն դեպքն է, երբ մարդիկ միմյանց հետ անհամաձայնություններ են հայտնում։

  • Բաց կոդով արհեստական ​​բանականություն — Նախագիծը հետևում է բաց կոդով սկզբունքներին իր ողջ փաթեթում: Կոդը գտնվում է OSI-ի կողմից հաստատված լիցենզիայի ներքո, իսկ տարածման պայմանները թույլ են տալիս լայնորեն օգտագործել, փոփոխել և կիսվել: Այստեղի ոգին արտացոլում է OSI-ի նկարագրածը. օգտատիրոջ ազատությունն առաջնային է [1][2]:

  • Բաց կշիռներ — Մարզված մոդելի կշիռները կարելի է ներբեռնել (հաճախ անվճար), բայց հատուկ պայմաններով։ Դուք կտեսնեք օգտագործման պայմանները, վերաբաշխման սահմանափակումները կամ հաշվետվությունների կանոնները։ Մետայի Լլամայի ընտանիքը սա է ցույց տալիս. կոդի էկոհամակարգը բաց է, բայց մոդելի կշիռները առաքվում են որոշակի լիցենզիայի ներքո՝ օգտագործման վրա հիմնված պայմաններով [4]:

  • Բաց մուտք — Կարող եք API-ի վրա աշխատել, գուցե անվճար, բայց կշիռները չեք ստանա։ Օգտակար է փորձարկումների համար, բայց բաց կոդով չէ։

Սա միայն իմաստաբանություն չէ։ Ձեր իրավունքներն ու ռիսկերը փոխվում են այս կատեգորիաներում։ OSI-ի ներկայիս աշխատանքը արհեստական ​​բանականության և բացության վերաբերյալ պարզ լեզվով բացահայտում է այս նրբությունները [2]:


Ի՞նչն է բաց կոդով արհեստական ​​բանականությունը դարձնում իրականում լավ ✅

Եկեք արագ և անկեղծ լինենք։

  • Աուդիտորականություն — Դուք կարող եք կարդալ կոդը, ստուգել տվյալների բաղադրատոմսերը և հետևել ուսուցման քայլերին։ Դա օգնում է համապատասխանությանը, անվտանգության վերանայումներին և ավանդական հետաքրքրասիրությանը։ NIST AI ռիսկերի կառավարման շրջանակը խրախուսում է փաստաթղթավորման և թափանցիկության պրակտիկաները, որոնք բաց նախագծերը կարող են ավելի հեշտությամբ բավարարել [3]:

  • Հարմարվողականություն — Դուք սահմանափակված չեք մատակարարի ճանապարհային քարտեզով։ Փոխարինեք այն։ Կարկատեք այն։ Առաքեք այն։ Լեգո, ոչ թե սոսնձված պլաստիկ։

  • Արժեքի վերահսկում — Ինքնուրույն հոսթինգ, երբ ավելի էժան է։ Պայթյուն դեպի ամպ, երբ ավելի էժան է։ Խառնեք և համապատասխանեցրեք սարքավորումները։

  • Համայնքի արագություն — Սխալները շտկվում են, առանձնահատկությունները հայտնվում են, և դուք սովորում եք հասակակիցներից։ Անկանոն՞։ Երբեմն։ Արդյունավե՞տ։ Հաճախ։

  • Կառավարման պարզություն . իրական բաց լիցենզիաները կանխատեսելի են: Համեմատեք դա API-ի ծառայության պայմանների հետ, որոնք աննկատելիորեն փոխվում են երեքշաբթի օրը:

Կատարյա՞լ է։ Ոչ։ Բայց փոխզիջումները հասկանալի են՝ ավելին, քան շատ «սև արկղ» ծառայություններից։


Բաց կոդով արհեստական ​​բանականության փաթեթ. կոդ, կշիռներ, տվյալներ և սոսինձ 🧩

Պատկերացրեք արհեստական ​​բանականության նախագիծը որպես յուրօրինակ լազանիա։ Շերտեր ամենուրեք։

  1. Շրջանակներ և կատարման ժամանակներ — Գործիքավորում մոդելներ սահմանելու, մարզելու և սպասարկելու համար (օրինակ՝ PyTorch, TensorFlow): Առողջ համայնքներն ու փաստաթղթերը ավելի կարևոր են, քան ապրանքանիշերը:

  2. Մոդելային ճարտարապետություններ — Նախագիծ՝ տրանսֆորմատորներ, դիֆուզիոն մոդելներ, վերականգնման-ընդլայնված կարգավորումներ։

  3. Կշիռներ — Ուսուցման ընթացքում սովորած պարամետրերը: Այստեղ «բաց» լինելը կախված է վերաբաշխման և առևտրային օգտագործման իրավունքներից, այլ ոչ թե միայն ներբեռնելիությունից:

  4. Տվյալներ և բաղադրատոմսեր ՝ խմբագրման սկրիպտներ, ֆիլտրեր, լրացումներ, մարզումների ժամանակացույցեր: Այստեղ թափանցիկությունը ոսկի է վերարտադրելիության համար:

  5. Գործիքավորում և կազմակերպում — եզրակացության սերվերներ, վեկտորային տվյալների բազաներ, գնահատման համակարգեր, դիտարկելիություն, CI/CD:

  6. Լիցենզավորում — Հանգիստ հիմքը, որը որոշում է, թե իրականում ինչ կարող եք անել։ Ավելին՝ ստորև։


Բաց կոդով արհեստական ​​բանականության լիցենզավորում 101 📜

Դուք պարտավոր չեք իրավաբան լինել։ Դուք պետք է նկատեք օրինաչափություններ։

  • Թույլատրելի կոդի լիցենզիաներ — MIT, BSD, Apache-2.0: Apache-ն ներառում է հստակ արտոնագրային թույլտվություն, որը շատ թիմեր գնահատում են [1]:

  • Հեղինակային իրավունք — GPL ընտանիքը պահանջում է, որ ածանցյալները մնան բաց նույն լիցենզիայի ներքո։ Հզոր է, բայց դա պլանավորեք ձեր ճարտարապետության մեջ։

  • Մոդելային լիցենզիաներ — Կշիռների և տվյալների հավաքածուների համար կտեսնեք հատուկ լիցենզիաներ, ինչպիսին է Responsible AI License ընտանիքը (OpenRAIL): Սրանք կոդավորում են օգտագործման վրա հիմնված թույլտվություններ և սահմանափակումներ. որոշները թույլ են տալիս առևտրային օգտագործում լայնորեն, մյուսները՝ պաշտպանիչ ցանկապատեր չարաշահման դեմ [5]:

  • Creative Commons տվյալների համար — CC-BY կամ CC0-ը տարածված են տվյալների հավաքածուների և փաստաթղթերի համար։ Վերագրումը կարող է կառավարելի լինել փոքր մասշտաբով. վաղ փուլում կառուցեք օրինաչափություն։

Խորհուրդ. պահեք մեկ էջանոց փաստաթուղթ, որտեղ նշված կլինի յուրաքանչյուր կախվածություն, դրա լիցենզիան և առևտրային վերաբաշխման թույլատրելիությունը։ Ձանձրալի՞ է։ Այո։ Անհրաժեշտ՞ է։ Այո։


Համեմատական ​​աղյուսակ. հայտնի բաց կոդով արհեստական ​​բանականության նախագծեր և որտեղ են դրանք փայլում 📊

մի փոքր խառնաշփոթ՝ միտումնավոր - այսպիսի տեսք ունեն իրական նոտաները

Գործիք / Նախագիծ Ում համար է դա Գինու չափ Ինչու է այն լավ աշխատում
PyTorch Հետազոտողներ, ինժեներներ Անվճար Դինամիկ գրաֆիկներ, հսկայական համայնք, հզոր փաստաթղթեր։ Մարտական ​​փորձարկումներ պրոդյուսերում։
TensorFlow Ձեռնարկությունների թիմեր, մեքենայական ուսուցման գործողություններ Անվճար Գրաֆի ռեժիմ, TF-սպասարկում, էկոհամակարգի խորություն: Որոշների համար ավելի խորը ուսուցում, դեռևս կայուն:
Գրկախառնվող դեմքի տրանսֆորմերներ Շինարարներ՝ ժամկետներով Անվճար Նախապես պատրաստված մոդելներ, խողովակաշարեր, տվյալների հավաքածուներ, հեշտ նուրբ կարգավորում։ Անկեղծ ասած՝ կարճ ճանապարհ։
vLLM Ինֆրակարմիր մտածողության թիմեր Անվճար Արագ LLM սպասարկում, արդյունավետ KV քեշ, բարձր թողունակություն սովորական GPU-ների վրա։
Llama.cpp Թինքերներ, եզրային սարքեր Անվճար Գործարկեք մոդելները տեղայնորեն նոութբուքերի և հեռախոսների վրա՝ քվանտացման միջոցով։
ԼանգՉեյն Հավելվածների մշակողներ, նախատիպեր մշակողներ Անվճար Կոմպոզիցիոն շղթաներ, միակցիչներ, գործակալներ։ Արագ հաղթանակներ, եթե պարզ մնաք։
Կայուն դիֆուզիա Ստեղծագործողներ, արտադրանքի թիմեր Ազատ կշիռներ Պատկերի ստեղծում տեղական կամ ամպային եղանակով. դրա շուրջ զանգվածային աշխատանքային հոսքեր և UI-ներ։
Օլամա Մշակողներ, ովքեր սիրում են տեղական CLI-ներ Անվճար Տեղական մոդելներ՝ «քաշիր և վազիր»։ Լիցենզիաները տարբերվում են մոդելի քարտից՝ ուշադրություն դարձրեք դրան։

Այո, շատ «անվճար» է։ Հոսթինգը, գրաֆիկական պրոցեսորները, պահեստային տարածքը և մարդաժամանակը անվճար չեն։


Ինչպես են ընկերությունները իրականում օգտագործում բաց կոդով արհեստական ​​բանականությունը աշխատանքում 🏢⚙️

Դուք կլսեք երկու ծայրահեղություն. կամ բոլորը պետք է ամեն ինչ ինքնուրույն վարեն, կամ ոչ ոք չպետք է դա անի։ Իրական կյանքն ավելի փափուկ է։

  1. Արագ նախատիպավորում — Սկսեք թույլատրելի բաց մոդելներից՝ UX-ը և ազդեցությունը ստուգելու համար։ Վերամշակեք ավելի ուշ։

  2. Հիբրիդային սպասարկում — Գաղտնիության պահպանմանը ենթակա զանգերի համար պահպանեք VPC-ով հոսթինգված կամ տեղում տեղադրված մոդելը։ Երկար պոչով կամ սուր բեռի դեպքում վերադարձեք հոսթինգային API-ի։ Շատ նորմալ է։

  3. Նուրբ կարգավորում նեղ առաջադրանքների համար — Դոմեյնի հարմարվողականությունը հաճախ գերազանցում է հում մասշտաբին։

  4. RAG ամենուրեք — Վերականգնմամբ լրացված գեներացիան նվազեցնում է հալյուցինացիաները՝ ձեր տվյալներում պատասխանները հիմնավորելով։ Բաց վեկտորային տվյալների բազաները և ադապտերները սա մատչելի են դարձնում։

  5. Edge և offline — Նոութբուքերի, հեռախոսների կամ զննարկիչների համար կազմված թեթև մոդելները ընդլայնում են արտադրանքի մակերեսները։

  6. Համապատասխանություն և աուդիտ . Քանի որ դուք կարող եք ստուգել ներքին համակարգերը, աուդիտորներն ունեն ինչ-որ կոնկրետ բան վերանայելու: Համադրեք դա պատասխանատու արհեստական ​​բանականության քաղաքականության հետ, որը համապատասխանում է NIST-ի RMF կատեգորիաներին և փաստաթղթավորման ուղեցույցին [3]:

Փոքրիկ նշում. գաղտնիության պահպանմանը միտված SaaS թիմ, որին ես տեսել եմ (միջին շուկայի, ԵՄ օգտատերեր), կիրառել է հիբրիդային կառուցվածք. փոքր բաց մոդել VPC-ի ներսում՝ հարցումների 80%-ի համար, իսկ հազվագյուտ, երկար համատեքստային հարցումների համար՝ հոսթինգային API-ի միջոցով։ Նրանք կրճատել են ընդհանուր ուղու լատենտությունը և պարզեցրել DPIA թղթաբանությունը՝ առանց օվկիանոսը եռացնելու։


Ռիսկերը և դժվարությունները, որոնց համար պետք է նախապես պլանավորել 🧨

Եկեք մեծահասակներ լինենք այս հարցում։

  • Լիցենզիայի շեղում — Պահոցը գործարկում է MIT-ը, ապա կշիռները տեղափոխվում են հատուկ լիցենզիայի վրա: Պահեք ձեր ներքին գրանցամատյանը թարմացված, հակառակ դեպքում կուղարկեք համապատասխանության անակնկալ [2][4][5]:

  • Տվյալների ծագում — Ֆազի իրավունքներով տվյալների մարզումը կարող է հոսել մոդելների մեջ։ Հետևեք աղբյուրներին և հետևեք տվյալների հավաքածուի լիցենզիաներին, այլ ոչ թե թրթռումներին [5]:

  • Անվտանգություն — Մոդելի արտեֆակտները վերաբերվեք ինչպես ցանկացած այլ մատակարարման շղթայի՝ ստուգիչ գումարների, ստորագրված թողարկումների, SBOM-ների: Նույնիսկ նվազագույն SECURITY.md-ն գերազանցում է լռությունը:

  • Որակի տատանում — Բաց մոդելները մեծապես տարբերվում են։ Գնահատեք ձեր առաջադրանքներով, այլ ոչ թե միայն վարկանիշային աղյուսակներով։

  • Թաքնված ենթակառուցվածքային ծախսեր — Արագ եզրակացությունը պահանջում է գրաֆիկական պրոցեսորներ, քվանտացում, խմբաքանակավորում, քեշավորում: Բաց գործիքները օգնում են. դուք դեռ վճարում եք հաշվարկման մեջ:

  • Կառավարման պարտք — Եթե մոդելի կյանքի ցիկլը ոչ ոքի չի պատկանում, դուք կստանաք կոնֆիգուրացիայի սպագետի։ Թեթև MLOps ստուգաթերթիկը ոսկի է։


Ձեր օգտագործման դեպքի համար ճիշտ բացության մակարդակի ընտրություն 🧭

Մի փոքր ծուռ որոշում կայացնելու ուղի.

  • Անհրաժեշտ է արագ առաքում կատարել ՝ փոքր համապատասխանության կարիքների դեպքում: Սկսեք թույլատրելի բաց մոդելներից, նվազագույն կարգավորումներից, ամպային սպասարկումից:

  • Անհրաժեշտ է խիստ գաղտնիություն կամ անցանց աշխատանք: Ընտրեք լավ աջակցվող բաց փաթեթ, ինքնուրույն հոսթինգի եզրակացություն և ուշադիր ստուգեք լիցենզիաները:

  • Անհրաժեշտ են լայն առևտրային իրավունքներ և վերաբաշխում: Նախընտրո՞ւմ եք OSI-ի հետ համատեղելի կոդ գումարած մոդելային լիցենզիաներ, որոնք բացահայտորեն թույլ են տալիս առևտրային օգտագործում և վերաբաշխում [1][5]:

  • Հետազոտական ​​ճկունություն է պե՞տք ։ Վերարտադրելիության և համատեղ օգտագործման համար օգտագործեք հետազոտական ​​մոտեցում՝ ներառյալ տվյալները։

  • Համոզված չե՞ք։ Փորձեք երկուսն էլ։ Մեկ ուղին ակնհայտորեն ավելի լավ կզգացվի մեկ շաբաթից։


Ինչպես գնահատել բաց կոդով արհեստական ​​բանականության նախագիծը որպես պրոֆեսիոնալ 🔍

Արագ ստուգաթերթիկ, որը պահում եմ, երբեմն՝ անձեռոցիկի վրա։

  1. Լիցենզիայի պարզություն ՝ OSI-ի կողմից հաստատված կոդի համար։ Իսկ ի՞նչ կասեք կշիռների և տվյալների մասին։ Կա՞ն օգտագործման որևէ սահմանափակումներ, որոնք խաթարում են ձեր բիզնես մոդելը [1][2][5]:

  2. Փաստաթղթեր — Տեղադրում, արագ մեկնարկ, օրինակներ, խնդիրների լուծում։ Փաստաթղթերը մշակույթի մասին են խոսում։

  3. Թողարկումների ռիթմ — Նշված թողարկումները և փոփոխությունների գրանցամատյանները ենթադրում են կայունություն, իսկ պարբերաբար կատարված հարձակումները՝ հերոսություններ։

  4. Չափանիշներ և գնահատումներ — Առաջադրանքները իրատեսական են։ Գնահատումները կատարելի՞ են։

  5. Սպասարկում և կառավարում — Կոդի հստակ սեփականատերեր, խնդիրների տեսակավորում, հասարակայնության հետ կապերի արձագանքման ունակություն։

  6. Էկոհամակարգի համապատասխանություն — Լավ է համադրվում ձեր սարքավորումների, տվյալների պահեստների, գրանցումների, վավերացման հետ։

  7. Անվտանգության դիրք — Ստորագրված արտեֆակտներ, կախվածությունների սկանավորում, CVE-ի մշակում։

  8. Համայնքի ազդանշան — Քննարկումներ, ֆորումի պատասխաններ, օրինակելի պահոցներ։

Հուսալի գործելակերպերի հետ ավելի լայն համապատասխանության համար ձեր գործընթացը համապատասխանեցրեք NIST AI RMF կատեգորիաներին և փաստաթղթավորման արտեֆակտներին [3]:


Խորը ուսումնասիրություն 1. մոդելային լիցենզիաների խառնաշփոթ միջակայքը 🧪

Առավել հզոր մոդելներից մի քանիսը գտնվում են «պայմաններով բաց կշիռներ» կատեգորիայում: Դրանք հասանելի են, բայց օգտագործման սահմանափակումներով կամ վերաբաշխման կանոններով: Դա կարող է լավ լինել, եթե ձեր արտադրանքը կախված չէ մոդելի վերափաթեթավորումից կամ հաճախորդների միջավայրեր առաքումից: Եթե ունեք , բանակցեք կամ ընտրեք այլ հիմք: Հիմնականը ձեր հետագա պլանները իրական լիցենզիայի տեքստին, այլ ոչ թե բլոգի գրառմանը [4][5]:

OpenRAIL ոճի լիցենզիաները փորձում են հավասարակշռություն հաստատել՝ խրախուսելով բաց հետազոտությունը և համատեղ օգտագործումը, միաժամանակ կանխելով չարաշահումը: Մտադրությունը բարի է, պարտավորությունները՝ դեռևս ձերը: Կարդացեք պայմանները և որոշեք, թե արդյոք պայմանները համապատասխանում են ձեր ռիսկի ախորժակին [5]:


Խորը ուսումնասիրություն 2. տվյալների թափանցիկությունը և վերարտադրելիության առասպելը 🧬

«Առանց ամբողջական տվյալների հավաքագրման, բաց կոդով արհեստական ​​բանականությունը կեղծ է»։ Ոչ այնքան։ Տվյալների ծագումը և բաղադրատոմսերը կարող են ապահովել իմաստալից թափանցիկություն, նույնիսկ երբ որոշ հում տվյալների հավաքածուներ սահմանափակված են։ Դուք կարող եք բավականաչափ լավ փաստաթղթավորել ֆիլտրերը, նմուշառման հարաբերակցությունները և մաքրման էվրիստիկաները, որպեսզի մեկ այլ թիմ կարողանա մոտավոր արդյունքներ ստանալ։ Կատարյալ վերարտադրելիությունը լավ է։ Գործնականում կիրառելի թափանցիկությունը հաճախ բավարար է [3][5]:

Երբ տվյալների հավաքածուները բաց են, տարածված են Creative Commons-ի այնպիսի տարբերակներ, ինչպիսիք են CC-BY-ն կամ CC0-ն: Մասշտաբային վերագրումը կարող է անհարմար լինել, ուստի վաղ փուլում ստանդարտացրեք դրա հետ աշխատելու եղանակը:


Խորը ուսումնասիրություն 3. գործնական MLO-ներ բաց մոդելների համար 🚢

Բաց մոդելի առաքումը նման է ցանկացած ծառայության առաքմանը՝ գումարած մի քանի առանձնահատկություններ։

  • Սպասարկման շերտ — Մասնագիտացված եզրակացության սերվերները օպտիմալացնում են փաթեթավորումը, KV-քեշի կառավարումը և տոկենների հոսքը։

  • Քվանտացում — Ավելի փոքր կշիռներ → ավելի էժան եզրակացություն և ավելի հեշտ եզրերի տեղակայում։ Որակի փոխզիջումները տարբեր են. չափեք ձեր առաջադրանքներին համապատասխան։

  • Դիտարկելիություն — Գրանցեք հուշումները/արտացոլումները՝ հաշվի առնելով գաղտնիությունը։ Նմուշ գնահատման համար։ Ավելացրեք շեղման ստուգումներ, ինչպես կանեիք ավանդական ML-ի դեպքում։

  • Թարմացումներ — Մոդելները կարող են աննկատելիորեն փոխել վարքագիծը. օգտագործել կանարներ և պահպանել արխիվ՝ հետկանչի և աուդիտների համար։

  • Գնահատման համակարգ — Պահպանեք առաջադրանքին հատուկ գնահատման հավաքածու, այլ ոչ թե միայն ընդհանուր չափորոշիչներ։ Ներառեք հակառակորդական հուշումներ և լատենտության բյուջեներ։


Փոքրիկ նախագիծ՝ զրոյից մինչև օգտագործելի օդաչու 10 քայլով 🗺️

  1. Սահմանեք մեկ նեղ խնդիր և չափանիշ։ Դեռևս մեծ հարթակներ չկան։

  2. Ընտրեք թույլատրող բազային մոդել, որը լայնորեն կիրառվում է և լավ փաստաթղթավորված։

  3. Ստեղծեք տեղական եզրակացություն և բարակ փաթաթան API: Թող այն ձանձրալի լինի:

  4. Ավելացրեք վերականգնում ձեր տվյալների գետնի ելքերին։

  5. Պատրաստեք փոքրիկ պիտակավորված գնահատման հավաքածու, որը կարտացոլի ձեր օգտատերերին՝ բոլոր թերություններով հանդերձ։

  6. Կարգավորեք կամ հուշեք միայն այն դեպքում, եթե գնահատումը ցույց է տալիս, որ պետք է դա անել։

  7. Քվանտացրեք, եթե լատենտությունը կամ ծախսերի խայթոցները կան։ Վերաչափեք որակը։

  8. Ավելացրեք գրանցում, կարմիր թիմավորման հուշումներ և չարաշահման քաղաքականություն։

  9. Բացել դարպասը առանձնահատկության դրոշով և թողարկել այն փոքր խմբի համար։

  10. Կրկնեք։ Ուղարկեք փոքր բարելավումներ ամեն շաբաթ… կամ երբ այն իսկապես ավելի լավն է։


Բաց կոդով արհեստական ​​բանականության մասին տարածված առասպելներ, որոնք մի փոքր հերքվել են 🧱

  • Միֆ. բաց մոդելները միշտ ավելի վատն են։ Իրականություն. ճիշտ տվյալներով թիրախային առաջադրանքների համար նուրբ կարգավորված բաց մոդելները կարող են գերազանցել ավելի մեծ հոսթինգային մոդելներին։

  • Միֆ. բացությունը նշանակում է անապահովություն։ Իրականություն. բացությունը կարող է բարելավել վերահսկողությունը։ Անվտանգությունը կախված է գործելակերպից, այլ ոչ թե գաղտնիությունից [3]:

  • Միֆ. լիցենզիան կարևոր չէ, թե արդյոք այն անվճար է։ Իրականություն. ամենակարևորը , երբ այն անվճար է, քանի որ անվճարը մասշտաբավորում է օգտագործումը։ Դուք ուզում եք հստակ իրավունքներ, այլ ոչ թե թրթռումներ [1][5]:


Բաց կոդով արհեստական ​​բանականություն 🧠✨

Բաց կոդով արհեստական ​​բանականությունը կրոն չէ։ Այն գործնական ազատությունների մի ամբողջություն է, որը թույլ է տալիս կառուցել ավելի մեծ վերահսկողությունով, ավելի հստակ կառավարմամբ և ավելի արագ իտերացիայով։ Երբ ինչ-որ մեկն ասում է, որ մոդելը «բաց է», հարցրեք, թե որ շերտերն են բաց՝ կոդը, կշիռները, տվյալները, թե՞ պարզապես մուտքը։ Կարդացեք լիցենզիան։ Համեմատեք այն ձեր օգտագործման դեպքի հետ։ Եվ այնուհետև, ամենակարևորը, փորձարկեք այն ձեր իրական աշխատանքային ծանրաբեռնվածության հետ։

Ամենալավ մասը, տարօրինակ կերպով, մշակութային է. բաց նախագծերը հրավիրում են ներդրումների և ուսումնասիրության, ինչը, որպես կանոն, ավելի լավ է դարձնում և՛ ծրագրային ապահովումը, և՛ մարդկանց: Դուք կարող եք հայտնաբերել, որ հաղթական քայլը ոչ թե ամենամեծ մոդելը կամ ամենափայլուն չափանիշն է, այլ այն, որը դուք իրականում կարող եք հասկանալ, շտկել և կատարելագործել հաջորդ շաբաթ: Սա բաց կոդով արհեստական ​​բանականության լուռ ուժն է՝ ոչ թե արծաթե փամփուշտ, այլ ավելի շատ նման է մաշված բազմագործիք, որը շարունակում է փրկել օրը:


Շատ երկար չեմ կարդացել 📝

Բաց կոդով արհեստական ​​բանականությունը վերաբերում է արհեստական ​​բանականության համակարգերն օգտագործելու, ուսումնասիրելու, փոփոխելու և կիսվելու իմաստալից ազատությանը: Այն դրսևորվում է բոլոր մակարդակներում՝ շրջանակներ, մոդելներ, տվյալներ և գործիքակազմ: Մի շփոթեք բաց կոդը բաց կշիռների կամ բաց մուտքի հետ: Ստուգեք լիցենզիան, գնահատեք ձեր իրական առաջադրանքները և նախագծեք անվտանգության և կառավարման համար առաջին օրվանից: Անեք դա, և դուք կստանաք արագություն, վերահսկողություն և ավելի հանգիստ ճանապարհային քարտեզ: Զարմանալիորեն հազվագյուտ, անկեղծ ասած՝ անգին 🙃:


Հղումներ

[1] Բաց կոդի նախաձեռնություն - Բաց կոդի սահմանում (OSD): կարդալ ավելին
[2] OSI - Արհեստական ​​բանականության և բացության խորը ուսումնասիրություն. կարդալ ավելին
[3] NIST - Արհեստական ​​բանականության ռիսկերի կառավարման շրջանակ. կարդալ ավելին
[4] Մետա - Լամա մոդելի լիցենզիա. կարդալ ավելին
[5] Պատասխանատու արհեստական ​​բանականության լիցենզիաներ (OpenRAIL): կարդալ ավելին

Գտեք արհեստական ​​բանականության վերջին նորույթները պաշտոնական արհեստական ​​բանականության օգնականների խանութում

Մեր մասին

Վերադառնալ բլոգ