Գեներատիվ արհեստական բանականության հիմնական նպատակը բավականին պարզ է.
Այն նախատեսված է նոր, հավանական բովանդակություն ՝ տեքստ, պատկերներ, աուդիո, կոդ, տեսանյութ, դիզայն ստեղծելու համար՝ առկա տվյալներից օրինաչափություններ սովորելով և այնուհետև հարցմանը համապատասխանող նոր արդյունքներ ստեղծելով։
Սա է միջուկը։ Մնացած ամեն ինչ (արտադրողականություն, ստեղծագործականություն, անհատականացում, սինթետիկ տվյալներ և այլն) հիմնականում «ի՞նչ կարող ենք անել այդ միջուկով» զրույց է։.
Հոդվածներ, որոնք կարող են ձեզ դուր գալ կարդալ սրանից հետո.
🔗 Ի՞նչ է գեներատիվ արհեստական բանականությունը
Հասկացեք, թե ինչպես են մոդելները ստեղծում տեքստ, պատկերներ, կոդ և այլն։.
🔗 Արհեստական բանականությունը գերագնահատվա՞ծ է
Հավասարակշռված հայացք գովազդի, սահմանափակումների և իրական աշխարհի ազդեցությանը։.
🔗 Ո՞ր արհեստական բանականությունն է ձեզ համար ճիշտ
Համեմատեք արհեստական բանականության հայտնի գործիքները և ընտրեք ամենահարմարը։.
🔗 Կա՞ արդյոք արհեստական բանականության «փուչիկ»
Հետևելու նշաններ, շուկայական ռիսկեր և ինչ է լինելու հաջորդիվ։.
Գեներատիվ արհեստական բանականության գլխավոր նպատակը🧠
Եթե ուզում եք ամենակարճ և ճշգրիտ բացատրությունը՝
-
Գեներատիվ արհեստական բանականությունը սովորում է տվյալների «ձևը» (լեզու, պատկերներ, երաժշտություն, կոդ)
-
Այնուհետև այն ստեղծում է նոր նմուշներ , որոնք համապատասխանում են այդ ձևին
-
Այն սա անում է ի պատասխան հուշման, համատեքստի կամ սահմանափակումների
Այո՛, այն կարող է գրել պարբերություն, նկար նկարել, մեղեդի վերամշակել, պայմանագրի կետ նախագծել, փորձարկման դեպքեր ստեղծել կամ լոգոտիպով բան նախագծել։.
Ոչ թե որովհետև այն «հասկանում է», ինչպես մարդը (մենք դրան կանդրադառնանք), այլ որովհետև այն լավ է արդյունքներ տալիս, որոնք վիճակագրորեն և կառուցվածքային առումով համապատասխանում են իր սովորած օրինաչափություններին։.
Եթե ցանկանում եք ունենալ մեծահասակների համար նախատեսված ձևակերպում այն մասին, թե «ինչպես օգտագործել սա առանց ոտնակների վրա ոտք դնելու», NIST-ի արհեստական բանականության ռիսկերի կառավարման շրջանակը հուսալի հիմք է ռիսկ + վերահսկողություն մտածողության համար: [1] Եվ եթե ցանկանում եք ինչ-որ բան, որը հատուկ մշակված է գեներատիվ արհեստական բանականության ռիսկերի համար (ոչ միայն արհեստական բանականության ընդհանուր առմամբ), NIST-ը նաև հրապարակել է GenAI պրոֆիլ, որն ավելի մանրամասնորեն անդրադառնում է այն բանին, թե ինչ է փոխվում, երբ համակարգը բովանդակություն է ստեղծում: [2]

Ինչո՞ւ են մարդիկ վիճում «գեներատիվ արհեստական բանականության գլխավոր նպատակի» շուրջ 😬
Մարդիկ միմյանց անտեսում են, քանի որ օգտագործում են «նպատակ» բառի տարբեր իմաստներ։
Ոմանք նկատի ունեն
-
Տեխնիկական նպատակ՝ ստեղծել իրատեսական, հետևողական արդյունքներ (միջուկը)
-
Բիզնեսի նպատակը՝ ծախսերի կրճատում, արտադրանքի ավելացում, փորձի անհատականացում
-
Մարդկային նպատակ՝ ստանալ օգնություն ավելի արագ մտածելու, ստեղծագործելու կամ շփվելու համար
Եվ այո, դրանք բախվում են։.
Եթե մենք մնանք անշարժ, գեներատիվ արհեստական բանականության հիմնական նպատակը սերունդ ստեղծելն է ՝ ստեղծելով նախկինում գոյություն չունեցող բովանդակություն՝ պայմանավորված մուտքային տվյալներով։
Գործարար բաները հոսանքն ի վար են։ Մշակութային խուճապը նույնպես հոսանքն ի վար է (կներեք… մի տեսակ 😬)։.
Ինչի՞ հետ են մարդիկ շփոթում GenAI-ը (և ինչու է դա կարևոր) 🧯
«Սա չէ» կարճ ցանկը վերացնում է շատ շփոթմունքներ.
GenAI-ը տվյալների բազա չէ
Այն չի «վերականգնում ճշմարտությունը»։ Այն ստեղծում է հավանական արդյունքներ։ Եթե ձեզ ճշմարտություն է պետք, դուք ավելացնում եք հիմնավորումներ (փաստաթղթեր, տվյալների բազաներ, մեջբերումներ, մարդկային ակնարկ)։ Այդ տարբերությունը, ըստ էության, ամբողջ հուսալիության պատմությունն է։ [2]
GenAI-ը ավտոմատ կերպով գործակալ չէ
Տեքստ ստեղծող մոդելը նույնը չէ, ինչ համակարգ, որը կարող է անվտանգ կերպով գործողություններ կատարել (ուղարկել էլ. փոստ, փոխել գրառումներ, տեղակայել կոդ): «Կարող է ստեղծել հրահանգներ» ≠ «պետք է կատարի դրանք»:
GenAI-ը մտադրություն չէ
Այն կարող է ստեղծել միտումնավոր հնչող բովանդակություն։ Դա նույնը չէ, ինչ միտումնավոր լինելը։.
Ի՞նչն է դարձնում գեներատիվ արհեստական բանականության տարբերակը լավը։ ✅
Ոչ բոլոր «գեներատիվ» համակարգերն են հավասարապես գործնական։ Գեներատիվ արհեստական բանականության լավ տարբերակը միայն այն չէ, որը ստեղծում է գեղեցիկ արդյունքներ, այլ այն է, որը ստեղծում է արժեքավոր, կառավարելի և բավականաչափ անվտանգ տվյալ համատեքստի համար։
Լավ տարբերակը սովորաբար ունենում է հետևյալը
-
Համահունչություն ՝ այն չի հակասում ինքն իրեն յուրաքանչյուր երկու նախադասության մեջ
-
Հիմնավորում - այն կարող է կապել արդյունքները ճշմարտության աղբյուրի հետ (փաստաթղթեր, մեջբերումներ, տվյալների բազաներ) 📌
-
Կառավարելիություն - դուք կարող եք կառավարել տոնը, ձևաչափը, սահմանափակումները (ոչ միայն տրամադրությունը հուշող)
-
Հուսալիություն - նմանատիպ հուշումները ստանում են նմանատիպ որակ, այլ ոչ թե ռուլետկայի արդյունքներ
-
Անվտանգության ռելսեր - այն նախագծված կերպով խուսափում է վտանգավոր, մասնավոր կամ արգելված ելքերից
-
Անկեղծ վարքագիծ . այն կարող է ասել «ես վստահ չեմ»՝ հորինելու փոխարեն
-
Աշխատանքային հոսքի համապատասխանություն . այն ինտեգրվում է մարդկանց աշխատանքի ձևին, այլ ոչ թե երևակայական աշխատանքային հոսքին։
NIST-ը այս ամբողջ զրույցը հիմնականում ներկայացնում է որպես «հուսալիություն + ռիսկերի կառավարում», որը… այն անհետաքրքիր բանն է, որը բոլորը կցանկանային, որ նրանք ավելի վաղ անեին։ [1][2]
Անկատար փոխաբերություն (պատրաստվեք). լավ գեներատիվ մոդելը նման է շատ արագաշարժ խոհանոցային օգնականի, որը կարող է ամեն ինչ պատրաստել… բայց երբեմն աղը շփոթում է շաքարի հետ, և ձեզ անհրաժեշտ են պիտակավորում և համտեսներ, որպեսզի չմատուցեք աղանդեր-ապուր 🍲🍰
Արագ, առօրյա մինի-պատյան (բաղադրյալ, բայց շատ սովորական) 🧩
Պատկերացրեք աջակցության թիմ, որը ցանկանում է, որ GenAI-ը պատասխաններ մշակի
-
Շաբաթ 1. «Պարզապես թող մոդելը պատասխանի տոմսերի հարցերին»։
-
Արդյունքը արագ է, վստահ… և երբեմն սխալ՝ թանկարժեք ձևերով։.
-
-
Շաբաթ 2։ Նրանք ավելացնում են վերականգնման գործառույթ (փաստեր է հանում հաստատված փաստաթղթերից) + ձևանմուշներ («միշտ հարցնել հաշվի ID-ն», «երբեք չխոստանալ վերադարձ» և այլն)։
-
Սխալները նվազում են, հետևողականությունը բարելավվում է։.
-
-
3-րդ շաբաթ. Նրանք ավելացնում են վերանայման գոտի (բարձր ռիսկի կատեգորիաների համար մարդկային հաստատում) + պարզ գնահատումներ («քաղաքականությունը նշված է», «հետ վերադարձման կանոնը պահպանվում է»):
-
Այժմ համակարգը տեղակայելի է։.
-
Այդ զարգացումը գործնականում NIST-ի հիմնական նպատակն է. մոդելը միայն մեկ մաս է. դրա շուրջը գտնվող կառավարման մեխանիզմներն են այն դարձնում բավականաչափ անվտանգ։ [1][2]
Համեմատական աղյուսակ - հայտնի գեներատիվ տարբերակներ (և ինչու են դրանք աշխատում) 🔍
Գները անընդհատ փոխվում են, ուստի սա միտումնավոր անորոշ է մնում։ Բացի այդ, կատեգորիաները համընկնում են։ Այո, դա նյարդայնացնող է։.
| Գործիք / մոտեցում | Լսարան | Գին (մոտավորապես) | Ինչու է այն աշխատում (և մի փոքրիկ առանձնահատկություն) |
|---|---|---|---|
| Ընդհանուր իրավունքի մագիստրոսի չաթի օգնականներ | Բոլորը, թիմեր | Անվճար մակարդակ + բաժանորդագրություն | Հիանալի է նախագծման, ամփոփման, գաղափարների փոխանակման համար։ Երբեմն վստահորեն սխալվում է… ինչպես համարձակ ընկերը 😬 |
| API LLM-ներ հավելվածների համար | Մշակողներ, արտադրանքի թիմեր | Օգտագործման վրա հիմնված | Հեշտ է ինտեգրվել աշխատանքային հոսքերի մեջ. հաճախ զուգակցվում է վերականգնման և գործիքների հետ։ Անհրաժեշտ են պաշտպանիչ ցանկապատեր, հակառակ դեպքում իրավիճակը կսրվի։ |
| Պատկերի գեներատորներ (դիֆուզիոն ոճով) | Ստեղծողներ, մարքեթոլոգներ | Բաժանորդագրություն/կրեդիտներ | Ուժեղ է ոճի + տարբերակման առումով, կառուցված է աղմուկը վերացնող ոճի ստեղծման մոդելների վրա [5] |
| Բաց կոդով գեներատիվ մոդելներ | Հաքերներ, հետազոտողներ | Անվճար ծրագրակազմ + սարքավորում | Կառավարում + անհատականացում, գաղտնիության պահպանման համար հարմար կարգավորումներ։ Բայց դուք վճարում եք կարգավորման ցավի (և GPU-ի ծանրաբեռնվածության) համար։ |
| Աուդիո/երաժշտության գեներատորներ | Երաժիշտներ, սիրողականներ | Կրեդիտներ/բաժանորդագրություն | Արագ մտահղացում մեղեդիների, ակունքների, ձայնային դիզայնի համար։ Լիցենզավորումը կարող է շփոթեցնող լինել (կարդացեք տերմինները) |
| Տեսանյութերի գեներատորներ | Ստեղծողներ, ստուդիաներ | Բաժանորդագրություն/կրեդիտներ | Արագ սցենարներ և կոնցեպտային հատվածներ։ Տեսարանների միջև համապատասխանությունը դեռևս գլխացավանք է։ |
| Վերականգնման-ընդլայնված գեներացիա (RAG) | Բիզնեսներ | Ինֆրակարմիր + օգտագործում | Օգնում է կապել ստեղծումը ձեր փաստաթղթերի հետ. «հորինված» նյութերի կրճատման տարածված կառավարման միջոց [2] |
| Սինթետիկ տվյալների գեներատորներ | Տվյալների թիմեր | Ձեռնարկության ոճով | Հարմար է, երբ տվյալները սակավ են/զգայուն. անհրաժեշտ է վավերացում, որպեսզի ստեղծված տվյալները չխաբեն ձեզ 😵 |
Գլխարկից ներքև. գեներացիան, ըստ էության, «նախշերի լրացում» է 🧩
Ոչ ռոմանտիկ ճշմարտությունը
Գեներատիվ արհեստական բանականության մեծ մասը «կանխատեսում է, թե ինչ է լինելու հաջորդը»՝ մեծացված մինչև այն զգացվի որպես ինչ-որ այլ բան։.
-
Տեքստում. հաջորդականությամբ ստեղծեք տեքստի հաջորդ հատվածը (նշանային)՝ դասական ավտոռեգրեսիվ կառուցվածքը, որը ժամանակակից հուշումները դարձրեց այդքան արդյունավետ [4]
-
Պատկերներում՝ սկսեք աղմուկից և իտերատիվ կերպով աղմկազերծեք այն կառուցվածքի (դիֆուզիոն ընտանիքի ինտուիցիա) [5]
Ահա թե ինչու են հուշումները կարևոր։ Դուք մոդելին տալիս եք մասնակի օրինաչափություն, և այն լրացնում է այն։.
Ահա թե ինչու գեներատիվ արհեստական բանականությունը կարող է հիանալի լինել հետևյալի համար
-
«Գրեք սա ավելի բարեկամական տոնով»
-
«Տվեք ինձ տասը վերնագրի տարբերակ»
-
«Այս նշումները վերածեք մաքուր պլանի»
-
«Ստեղծել scaffolding կոդ + թեստեր»
...և նաև, թե ինչու այն կարող է դժվարություններ ունենալ՝
-
խիստ փաստական ճշգրտություն՝ առանց հիմնավորման
-
դատողությունների երկար, փխրուն շղթաներ
-
հետևողական ինքնություն բազմաթիվ արդյունքների միջև (կերպարներ, ապրանքանիշի ձայն, կրկնվող մանրամասներ)
Դա մարդու պես «մտածել» չէ։ Դա հավանական շարունակություններ է ստեղծում։ Արժեքավոր է, բայց տարբեր։.
Ստեղծագործական բանավեճ՝ «ստեղծագործել» vs «ռեմիքս» 🎨
Մարդիկ այստեղ անհամաչափորեն տաքանում են։ Ես մոտավորապես հասկանում եմ։.
Գեներատիվ արհեստական բանականությունը հաճախ ստեղծում է տպավորություն , քանի որ այն կարող է.
-
համատեղել հասկացությունները
-
արագ ուսումնասիրեք տատանումները
-
մակերեսային զարմանալի ասոցիացիաներ
-
ընդօրինակել ոճերը սարսափելի ճշգրտությամբ
Բայց դա միտում չունի։ Ոչ մի ներքին ճաշակ։ Ոչ մի «ես սա ստեղծեցի, որովհետև դա ինձ համար կարևոր է» միտք։
Մի փոքր հետադարձ հայացք. մարդիկ նույնպես անընդհատ ռեմիքսներ են անում։ Մենք դա անում ենք պարզապես ապրած փորձով, նպատակներով և ճաշակով։ Այսպիսով, լեյբլը կարող է մնալ վիճարկելի։ Գործնականում դա ստեղծագործական լծակ , և սա է ամենակարևոր մասը։
Սինթետիկ տվյալներ՝ աննկատելիորեն թերագնահատված նպատակը 🧪
Գեներատիվ արհեստական բանականության զարմանալիորեն կարևոր ճյուղերից մեկը վերաբերում է իրական տվյալների նման վարքագծվող տվյալների ստեղծմանը՝ առանց իրական անհատների կամ հազվագյուտ զգայուն դեպքերի բացահայտման։.
Ինչու է դա արժեքավոր
-
գաղտնիության և համապատասխանության սահմանափակումներ (իրական գրառումների ավելի քիչ բացահայտում)
-
հազվագյուտ իրադարձությունների սիմուլյացիա (խարդախության եզրային դեպքեր, նեղ մասնագիտացված խողովակաշարերի խափանումներ և այլն)
-
խողովակաշարերի փորձարկում՝ առանց արտադրական տվյալների օգտագործման
-
տվյալների լրացում, երբ իրական տվյալների հավաքածուները փոքր են
Բայց խնդիրը մնում է միայն խնդիր. սինթետիկ տվյալները կարող են աննկատ վերարտադրել նույն կողմնակալությունները և կույր կետերը, ինչ սկզբնական տվյալները, այդ իսկ պատճառով կառավարումն ու չափումը նույնքան կարևոր են, որքան ստեղծումը։ [1][2][3]
Սինթետիկ տվյալները նման են անկոֆեին սուրճին՝ այն ունի համապատասխան տեսք, հաճելի հոտ, բայց երբեմն այն չի կատարում այն աշխատանքը, որը դուք կարծում էիք ☕🤷
Սահմանափակումները՝ ինչի մեջ է վատ գեներատիվ արհեստական բանականությունը (և ինչու) 🚧
Եթե հիշում եք միայն մեկ նախազգուշացում, հիշեք սա
Գեներատիվ մոդելները կարող են ստեղծել սահուն անհեթեթություններ։.
Հաճախակի ձախողման ռեժիմներ
-
Հալյուցինացիաներ ՝ փաստերի, մեջբերումների կամ իրադարձությունների վստահ հորինում
-
Հնացած գիտելիքներ . լուսանկարների վրա մարզված մոդելները կարող են բաց թողնել թարմացումները
-
Արագության փխրունություն . բառապաշարի փոքր փոփոխությունները կարող են մեծ արդյունքի տատանումներ առաջացնել
-
Թաքնված կողմնակալություն ՝ աղավաղված տվյալներից ստացված օրինաչափություններ
-
Չափից շատ համապատասխանություն ՝ այն փորձում է օգնել նույնիսկ այն դեպքում, երբ չպետք է օգնի
-
Անհամապատասխան դատողություններ , հատկապես երկար առաջադրանքների դեպքում
Ահա թե ինչու է գոյություն ունենում «վստահելի արհեստական ինտելեկտ» խոսակցությունը. թափանցիկությունը, հաշվետվողականությունը, կայունությունը և մարդակենտրոն դիզայնը հաճելի բաներ չեն. դրանք այն միջոցն են, որով դուք խուսափում եք վստահության թնդանոթը արտադրության մեջ մտցնելուց: [1][3]
Հաջողության չափում. իմանալ, թե երբ է նպատակը ձեռք բերվել 📏
Եթե Generative AI-ի հիմնական նպատակը «արժեքավոր նոր բովանդակություն ստեղծելն» է, ապա հաջողության չափանիշները սովորաբար բաժանվում են երկու խմբի՝
Որակի չափանիշներ (մարդկային և ավտոմատացված)
-
ճշգրտություն (եթե կիրառելի է)
-
համահունչություն և պարզություն
-
ոճի համապատասխանություն (տոն, ապրանքանիշի ձայն)
-
ամբողջականություն (ընդգրկում է ձեր խնդրածը)
Աշխատանքային հոսքի չափանիշներ
-
խնայված ժամանակ մեկ առաջադրանքի համար
-
վերանայումների կրճատում
-
ավելի բարձր թողունակություն՝ առանց որակի անկման
-
օգտագործողի գոհունակություն (ամենաարտահայտիչ չափանիշը, նույնիսկ եթե դժվար է քանակականացնել)
Մարզման ընթացքում թիմերը բախվեցին անհարմար իրականության
-
մոդելը կարող է արագ ստեղծել «բավականաչափ լավ» նախագծեր
-
սակայն որակի վերահսկողությունը դառնում է նոր խոչընդոտ
Այսպիսով, իրական հաղթանակը միայն գեներացիան չէ։ Այն գեներացիա է՝ գումարած վերանայման համակարգեր՝ վերականգնման հիմնավորում, գնահատման փաթեթներ, գրանցում, կարմիր թիմավորում, էսկալացիայի ուղիներ… բոլոր այն անհետաքրքիր բաները, որոնք այն իրական են դարձնում։ [2]
Գործնական «օգտագործեք այն առանց զղջալու» ուղեցույցներ 🧩
Եթե դուք օգտագործում եք գեներատիվ արհեստական բանականություն ոչ միայն առօրյա զվարճանքից, ապա մի քանի սովորություններ շատ կօգնեն ձեզ
-
Հարցրեք կառուցվածքի մասին. «Տվեք ինձ համարակալված պլան, ապա՝ նախագիծ»։
-
Սահմանափակումներ. «Օգտագործեք միայն այս փաստերը։ Եթե բացակայում են, ասեք, թե ինչն է բացակայում»։
-
Հարցում անորոշության մասին. «Ցուցակագրեք ենթադրությունները + վստահությունը»։
-
Օգտագործեք հիմնավորում. միացեք փաստաթղթերին/տվյալների բազաներին, երբ փաստերը կարևոր են [2]
-
Արդյունքները դիտարկեք որպես նախագծեր՝ նույնիսկ գերազանցերը
Եվ ամենապարզ հնարքը ամենամարդկայինն է՝ բարձրաձայն կարդացեք այն։ Եթե այն հնչում է այնպես, կարծես ռոբոտը փորձում է տպավորություն թողնել ձեր ղեկավարի վրա, ապա հավանաբար խմբագրման կարիք ունի 😅
Ամփոփում 🎯
Գեներատիվ արհեստական բանականության հիմնական նպատակն է ստեղծել նոր բովանդակություն, որը համապատասխանում է որևէ հուշման կամ սահմանափակման ՝ տվյալներից օրինաչափություններ սովորելով և հավանական արդյունքներ ստանալով։
Այն հզոր է, քանի որ այն՝
-
արագացնում է նախագծման և գաղափարի ձևավորումը
-
էժանորեն բազմապատկում է տարբերակները
-
օգնում է լրացնել հմտությունների բացերը (գրավոր աշխատանք, կոդավորում, դիզայն)
Դա ռիսկային է, քանի որ այն՝
-
կարող է սահուն կերպով հորինել փաստերը
-
ժառանգում է կողմնակալություն և կույր կետեր
-
լուրջ համատեքստերում կարիք ունի հիմնավորման և վերահսկողության [1][2][3]
Լավ օգտագործման դեպքում այն ավելի քիչ «փոխարինող ուղեղ» է, քան «տուրբո շարժիչ»։
Վատ օգտագործման դեպքում այն վստահության թնդանոթ է, որը ուղղված է ձեր աշխատանքային հոսքին… և դա արագ թանկանում է 💥
Հղումներ
[1] NIST-ի AI RMF - արհեստական ինտելեկտի ռիսկերի և վերահսկողության կառավարման շրջանակ։ կարդալ ավելին
[2] NIST AI 600-1 GenAI պրոֆիլ - GenAI-ին հատուկ ռիսկերի և մեղմացման ուղեցույց (PDF): կարդալ ավելին
[3] OECD AI սկզբունքներ - պատասխանատու արհեստական ինտելեկտի համար բարձր մակարդակի սկզբունքների ամբողջություն։ կարդալ ավելին
[4] Բրաուն և այլք (NeurIPS 2020) - հիմնարար հոդված մեծ լեզվական մոդելներով մի քանի կրակոցով հուշումների վերաբերյալ (PDF): կարդալ ավելին
[5] Հո և այլք (2020) - դիֆուզիոն մոդելի հոդված, որը նկարագրում է աղմուկից ազատման վրա հիմնված պատկերի ստեղծումը (PDF): կարդալ ավելին