Արհեստական բանականությունը երբեմն գրեթե կախարդական հնարքի է նման։ Դուք պատահական հարց եք գրում, և բամ՝ վայրկյանների ընթացքում հայտնվում է հղկված, հղկված պատասխան։ Բայց ահա թե ինչն է խնդիրը. յուրաքանչյուր «հանճարեղ» մեքենայի հետևում կան իրական մարդիկ, որոնք ճանապարհին հրում, ուղղում և ձևավորում են այն։ Այդ մարդկանց անվանում են արհեստական բանականության մարզիչներ , և նրանց կատարած աշխատանքն ավելի տարօրինակ է, ավելի զվարճալի և, անկեղծ ասած, ավելի մարդկային, քան մարդկանց մեծ մասը կարծում է։
Եկեք քննարկենք, թե ինչու են այս մարզիչները կարևոր, ինչպիսին է նրանց առօրյան և ինչու է այս դերը ավելի արագ զարգանում, քան որևէ մեկը կանխատեսում էր։
Հոդվածներ, որոնք կարող են ձեզ դուր գալ կարդալ սրանից հետո.
🔗 Ի՞նչ է արհեստական բանականության արբիտրաժը. այս տարածված բառի հետևում կանգնած ճշմարտությունը
Բացատրում է արհեստական բանականության արբիտրաժը, դրա ռիսկերը, օգուտները և տարածված թյուրըմբռնումները։
🔗 Արհեստական բանականության տվյալների պահպանման պահանջները. Ինչ դուք իսկապես պետք է իմանաք
Ծածկում է արհեստական բանականության համակարգերի պահեստավորման կարիքները, մասշտաբայնությունը և արդյունավետությունը։
🔗 Ո՞վ է արհեստական բանականության հայրը։
Ուսումնասիրում է արհեստական բանականության ռահվիրաներին և արհեստական բանականության ծագումը։
Ի՞նչն է դարձնում արհեստական բանականության մարզիչը լավը։ 🏆
Սա կոճակ սեղմելու աշխատանք չէ։ Լավագույն մարզիչները հենվում են տաղանդների բավականին տարօրինակ խառնուրդի վրա.
-
Համբերություն (շատ) - Մոդելները միանգամից չեն սովորում: Մարզիչները շարունակում են նույն ուղղումները կատարել, մինչև դրանք համոզվեն:
-
Նրբերանգի նկատում - Մարդկային հետադարձ կապի առավելությունը սարկազմի, մշակութային համատեքստի կամ կողմնակալության նկատումն է [1]:
-
Պարզ հաղորդակցություն - Աշխատանքի կեսը հստակ հրահանգներ գրելն է, որոնք արհեստական բանականությունը չի կարող սխալ կարդալ:
-
Հետաքրքրասիրություն + էթիկա - Լավ մարզիչը կասկածի տակ է դնում պատասխանի «փաստորեն ճիշտ» լինելը, բայց սոցիալապես անտարբեր է. սա արհեստական բանականության վերահսկողության հիմնական թեման է [2]:
Պարզ ասած՝ մարզիչը մասամբ ուսուցիչ է, մասամբ խմբագիր և մի փոքր էլ էթիկայի մասնագետ։
Արհեստական բանականության մարզչի դերերի համառոտ ակնարկ (որոշ առանձնահատկություններով 😉)
| Դերի տեսակը | Ո՞վ է ամենից շատ համապատասխանում | Տիպիկ վճար | Ինչու է այն աշխատում (կամ չի աշխատում) |
|---|---|---|---|
| Տվյալների պիտակավորիչ | Մարդիկ, ովքեր սիրում են մանրուքները | Ցածր-միջին $$ | Անկասկած կարևոր է. եթե պիտակները անփույթ են, ամբողջ մոդելը կտուժի [3] 📊 |
| RLHF մասնագետ | Գրողներ, խմբագիրներ, վերլուծաբաններ | Միջին-բարձր $$ | Դասակարգում և վերաշարադրում է պատասխանները՝ համապատասխանեցնելով տոնը և պարզությունը մարդկային սպասումներին [1] |
| Դոմեյնի մարզիչ | Իրավաբաններ, բժիշկներ, փորձագետներ | Ամբողջ քարտեզի վրա 💼 | Աշխատում է նիշային տերմինաբանության և արդյունաբերական համակարգերի համար նախատեսված եզրային օրինակների հետ |
| Անվտանգության գնահատող | Էթիկայի հետևորդ մարդիկ | Միջին $$ | Կիրառում է ուղեցույցներ, որպեսզի արհեստական բանականությունը խուսափի վնասակար բովանդակությունից [2][5] |
| Ստեղծագործական մարզիչ | Նկարիչներ, պատմողներ | Անկանխատեսելի 💡 | Օգնում է արհեստական բանականությանը արտացոլել երևակայությունը՝ մնալով անվտանգ սահմաններում [5] |
(Այո, ձևաչափումը մի փոքր խառնաշփոթ է՝ մի փոքր նման է աշխատանքին):
Մի օր արհեստական ինտելեկտի մարզչի կյանքից
Այսպիսով, ինչպիսի՞ն է իրական աշխատանքը։ Պատկերացրեք ավելի քիչ շքեղ կոդավորում և ավելին։
-
Արհեստական բանականության կողմից գրված պատասխանների դասակարգում վատագույնից լավագույնը (դասական RLHF քայլ) [1]:
-
Խճճվածքների շտկում (օրինակ՝ երբ մոդելը մոռանում է, որ Վեներան Մարս չէ):
-
Վերաշարադրել չաթբոտի պատասխանները, որպեսզի դրանք ավելի բնական հնչեն։
-
Տեքստի, պատկերների կամ աուդիոյի լեռերի պիտակավորում՝ որտեղ ճշգրտությունն իսկապես կարևոր է [3]:
-
Քննարկումներ այն մասին, թե արդյոք «տեխնիկապես ճիշտը» բավարար է, թե՞ անվտանգության ուղեցույցները պետք է գերակշռեն [2]:
Մասամբ ձանձրալի է, մասամբ՝ հանելուկ։ Անկեղծ ասած, պատկերացրեք, որ թութակին սովորեցնում եք ոչ միայն խոսել, այլև մի փոքր սխալ բառեր չօգտագործել. սա է մթնոլորտը։ 🦜
Ինչու են մարզիչները շատ ավելի կարևոր, քան դուք կարծում եք
Առանց մարդկանց կառավարման, արհեստական բանականությունը կանի հետևյալը՝
-
Հնչում է կոշտ և ռոբոտիկ։
-
Անվերահսկելի կողմնակալության տարածում (սարսափելի միտք):
-
Ամբողջովին կարոտում եմ հումորը կամ կարեկցանքը։
-
Ավելի քիչ անվտանգ եղեք զգայուն իրավիճակներում։
Մարզիչներն են, ովքեր ներթափանցում են «անկարգ մարդկային բաների» մեջ՝ ժարգոն, ջերմություն, երբեմն-երբեմն անհարմար փոխաբերություն, միաժամանակ պաշտպանիչ ցանկապատեր կիրառելով՝ իրերը անվտանգ պահելու համար [2][5]:
Հմտություններ, որոնք իրականում կարևոր են
Մոռացեք այն առասպելը, որ ձեզ անհրաժեշտ է դոկտորական աստիճան։ Ամենաշատը օգնում է հետևյալը.
-
Գրելու + խմբագրման նրբերանգներ - Հղկված, բայց բնական հնչողությամբ տեքստ [1]:
-
Վերլուծական մտածողություն ՝ մոդելի կրկնվող սխալների հայտնաբերում և ճշգրտումներ։
-
Մշակութային իրազեկություն - Իմանալ, թե երբ կարող է սխալ լինել բառակապակցությունը [2]:
-
Համբերություն , որովհետև արհեստական բանականությունը միանգամից չի ընկալվում։
Բոնուսային միավորներ բազմալեզու հմտությունների կամ մասնագիտացված գիտելիքների համար։
Որտեղ են մարզիչները ներկայանում 🌍
Այս աշխատանքը միայն չաթբոտների մասին չէ. այն ներթափանցում է բոլոր ոլորտներ։
-
Առողջապահություն - սահմանային դեպքերի համար ծանոթագրությունների գրման կանոններ (արձագանք առողջապահության արհեստական բանականության ուղեցույցում) [2]:
-
Ֆինանսներ - Խարդախության հայտնաբերման համակարգերի վերապատրաստում՝ առանց մարդկանց կեղծ տագնապների մեջ խեղդելու [2]:
-
Մանրածախ առևտուր - Դասավանդման օգնականներ՝ գնորդների ժարգոնային լեզու ստանալու համար՝ միաժամանակ պահպանելով ապրանքանիշի տոնը [5]:
-
Կրթություն - Ուսուցման բոտերի ձևավորումը՝ խրախուսական լինելու փոխարեն հովանավորչական լինելու [5]:
Հիմնականում. եթե արհեստական բանականությունը տեղ ունի սեղանի շուրջ, ապա ֆոնին մարզիչ է թաքնված։
Էթիկայի մաս (չի կարելի բաց թողնել սա)
Ահա թե որտեղ է այն դառնում կարևոր։ Անվերահսկելի մնալով՝ արհեստական բանականությունը կրկնում է կարծրատիպերը, սխալ տեղեկատվությունը կամ ավելի վատ բաներ։ Մարզիչները կանխում են դա՝ օգտագործելով RLHF-ի կամ սահմանադրական կանոնների նման մեթոդներ, որոնք մոդելներին ուղղորդում են դեպի օգտակար, անվնաս պատասխաններ [1][5]:
Օրինակ՝ եթե բոտը կողմնակալ աշխատանքային առաջարկություններ է անում, մարզիչը նշում է դա, վերաշարադրում է կանոնների ցանկը և համոզվում, որ դա այլևս չի կրկնվի։ Սա գործողության մեջ անտեսում է [2]:
Ոչ այնքան զվարճալի կողմը
Ամեն ինչ այդքան էլ փայլուն չէ։ Մարզիչները զբաղվում են հետևյալ հարցերով.
-
Միապաղաղություն - Անվերջ պիտակավորումը հնանում է:
-
Զգացմունքային հոգնածություն - վնասակար կամ անհանգստացնող բովանդակության վերանայումը կարող է հետևանքներ ունենալ. աջակցության համակարգերը կարևոր դեր են խաղում [4]:
-
Ճանաչման պակաս - Օգտատերերը հազվադեպ են գիտակցում մարզիչների գոյության մասին:
-
Անընդհատ փոփոխություն - Գործիքները անընդհատ զարգանում են, ինչը նշանակում է, որ մարզիչները պետք է համընթաց քայլեն։
Այնուամենայնիվ, շատերի համար տեխնոլոգիաների «ուղեղները» ձևավորելու հուզմունքը նրանց կախվածության մեջ է պահում։
Արհեստական բանականության թաքնված MVP-ները
Այսպիսով, ովքե՞ր են արհեստական բանականության մարզիչները: Նրանք կամուրջ են հում ալգորիթմների և իրականում աշխատող : Առանց նրանց արհեստական բանականությունը կլիներ գրադարանի նման՝ առանց գրադարանավարների՝ տոննաներով տեղեկատվություն, բայց գրեթե անհնար է օգտագործել:
Հաջորդ անգամ, երբ չաթբոտը ձեզ ծիծաղեցնի կամ զարմանալիորեն «համաձայնության մեջ» զգաք, շնորհակալություն հայտնեք մարզչին։ Նրանք լուռ կերպարներ են, որոնք մեքենաները դարձնում են ոչ միայն հաշվարկներ, այլև կապակցված [1][2][5]:
Հղումներ
[1] Օույանգ, Լ. և այլք (2022): Լեզվական մոդելների վարժեցում՝ մարդկային հետադարձ կապի միջոցով հրահանգներին հետևելու համար (InstructGPT): NeurIPS: Հղում
[2] NIST (2023): Արհեստական բանականության ռիսկերի կառավարման շրջանակ (AI RMF 1.0): Հղում
[3] Նորթքաթ, Ք. և այլք (2021): Փորձարկման հավաքածուներում տարածված պիտակների սխալները անկայունացնում են մեքենայական ուսուցման չափանիշները: NeurIPS տվյալների հավաքածուներ և չափանիշներ: Հղում
[4] ԱՀԿ/ԱՄԿ (2022): Աշխատանքի վայրում հոգեկան առողջության վերաբերյալ ուղեցույցներ: Հղում
[5] Բայ, Յ. և այլք (2022): Կոնստիտուցիոնալ արհեստական ինտելեկտ. Արհեստական ինտելեկտի հետադարձ կապից անվնասություն: arXiv. Հղում