Ի՞նչ է արհեստական բանականության մարզիչը։

Արհեստական բանականությունը երբեմն գրեթե կախարդական հնարքի է նման։ Դուք պատահական հարց եք գրում, և բամ՝ վայրկյանների ընթացքում հայտնվում է հղկված, հղկված պատասխան։ Բայց ահա թե ինչն է խնդիրը. յուրաքանչյուր «հանճարեղ» մեքենայի հետևում կան իրական մարդիկ, որոնք ճանապարհին հրում, ուղղում և ձևավորում են այն։ Այդ մարդկանց անվանում են արհեստական բանականության մարզիչներ , և նրանց կատարած աշխատանքն ավելի տարօրինակ է, ավելի զվարճալի և, անկեղծ ասած, ավելի մարդկային, քան մարդկանց մեծ մասը կարծում է։

Եկեք քննարկենք, թե ինչու են այս մարզիչները կարևոր, ինչպիսին է նրանց առօրյան և ինչու է այս դերը ավելի արագ զարգանում, քան որևէ մեկը կանխատեսում էր։

Հոդվածներ, որոնք կարող են ձեզ դուր գալ կարդալ սրանից հետո.

🔗 Ի՞նչ է արհեստական բանականության արբիտրաժը. այս տարածված բառի հետևում կանգնած ճշմարտությունը
Բացատրում է արհեստական բանականության արբիտրաժը, դրա ռիսկերը, օգուտները և տարածված թյուրըմբռնումները։

🔗 Արհեստական բանականության տվյալների պահպանման պահանջները. Ինչ դուք իսկապես պետք է իմանաք
Ծածկում է արհեստական բանականության համակարգերի պահեստավորման կարիքները, մասշտաբայնությունը և արդյունավետությունը։

🔗 Ո՞վ է արհեստական բանականության հայրը։
Ուսումնասիրում է արհեստական բանականության ռահվիրաներին և արհեստական բանականության ծագումը։

Ի՞նչն է դարձնում արհեստական բանականության մարզիչը լավը։ 🏆

Սա կոճակ սեղմելու աշխատանք չէ։ Լավագույն մարզիչները հենվում են տաղանդների բավականին տարօրինակ խառնուրդի վրա.

Համբերություն (շատ) - Մոդելները միանգամից չեն սովորում: Մարզիչները շարունակում են նույն ուղղումները կատարել, մինչև դրանք համոզվեն:
Նրբերանգի նկատում - Մարդկային հետադարձ կապի առավելությունը սարկազմի, մշակութային համատեքստի կամ կողմնակալության նկատումն է [1]:
Պարզ հաղորդակցություն - Աշխատանքի կեսը հստակ հրահանգներ գրելն է, որոնք արհեստական բանականությունը չի կարող սխալ կարդալ:
Հետաքրքրասիրություն + էթիկա - Լավ մարզիչը կասկածի տակ է դնում պատասխանի «փաստորեն ճիշտ» լինելը, բայց սոցիալապես անտարբեր է. սա արհեստական բանականության վերահսկողության հիմնական թեման է [2]:

Պարզ ասած՝ մարզիչը մասամբ ուսուցիչ է, մասամբ խմբագիր և մի փոքր էլ էթիկայի մասնագետ։

Արհեստական բանականության մարզչի դերերի համառոտ ակնարկ (որոշ առանձնահատկություններով 😉)

Դերի տեսակը	Ո՞վ է ամենից շատ համապատասխանում	Տիպիկ վճար	Ինչու է այն աշխատում (կամ չի աշխատում)
Տվյալների պիտակավորիչ	Մարդիկ, ովքեր սիրում են մանրուքները	Ցածր-միջին $$	Անկասկած կարևոր է. եթե պիտակները անփույթ են, ամբողջ մոդելը կտուժի [3] 📊
RLHF մասնագետ	Գրողներ, խմբագիրներ, վերլուծաբաններ	Միջին-բարձր $$	Դասակարգում և վերաշարադրում է պատասխանները՝ համապատասխանեցնելով տոնը և պարզությունը մարդկային սպասումներին [1]
Դոմեյնի մարզիչ	Իրավաբաններ, բժիշկներ, փորձագետներ	Ամբողջ քարտեզի վրա 💼	Աշխատում է նիշային տերմինաբանության և արդյունաբերական համակարգերի համար նախատեսված եզրային օրինակների հետ
Անվտանգության գնահատող	Էթիկայի հետևորդ մարդիկ	Միջին $$	Կիրառում է ուղեցույցներ, որպեսզի արհեստական բանականությունը խուսափի վնասակար բովանդակությունից [2][5]
Ստեղծագործական մարզիչ	Նկարիչներ, պատմողներ	Անկանխատեսելի 💡	Օգնում է արհեստական բանականությանը արտացոլել երևակայությունը՝ մնալով անվտանգ սահմաններում [5]

(Այո, ձևաչափումը մի փոքր խառնաշփոթ է՝ մի փոքր նման է աշխատանքին):

Մի օր արհեստական ինտելեկտի մարզչի կյանքից

Այսպիսով, ինչպիսի՞ն է իրական աշխատանքը։ Պատկերացրեք ավելի քիչ շքեղ կոդավորում և ավելին։

Արհեստական բանականության կողմից գրված պատասխանների դասակարգում վատագույնից լավագույնը (դասական RLHF քայլ) [1]:
Խճճվածքների շտկում (օրինակ՝ երբ մոդելը մոռանում է, որ Վեներան Մարս չէ):
Վերաշարադրել չաթբոտի պատասխանները, որպեսզի դրանք ավելի բնական հնչեն։
Տեքստի, պատկերների կամ աուդիոյի լեռերի պիտակավորում՝ որտեղ ճշգրտությունն իսկապես կարևոր է [3]:
Քննարկումներ այն մասին, թե արդյոք «տեխնիկապես ճիշտը» բավարար է, թե՞ անվտանգության ուղեցույցները պետք է գերակշռեն [2]:

Մասամբ ձանձրալի է, մասամբ՝ հանելուկ։ Անկեղծ ասած, պատկերացրեք, որ թութակին սովորեցնում եք ոչ միայն խոսել, այլև մի փոքր սխալ բառեր չօգտագործել. սա է մթնոլորտը։ 🦜

Ինչու են մարզիչները շատ ավելի կարևոր, քան դուք կարծում եք

Առանց մարդկանց կառավարման, արհեստական բանականությունը կանի հետևյալը՝

Հնչում է կոշտ և ռոբոտիկ։
Անվերահսկելի կողմնակալության տարածում (սարսափելի միտք):
Ամբողջովին կարոտում եմ հումորը կամ կարեկցանքը։
Ավելի քիչ անվտանգ եղեք զգայուն իրավիճակներում։

Մարզիչներն են, ովքեր ներթափանցում են «անկարգ մարդկային բաների» մեջ՝ ժարգոն, ջերմություն, երբեմն-երբեմն անհարմար փոխաբերություն, միաժամանակ պաշտպանիչ ցանկապատեր կիրառելով՝ իրերը անվտանգ պահելու համար [2][5]:

Հմտություններ, որոնք իրականում կարևոր են

Մոռացեք այն առասպելը, որ ձեզ անհրաժեշտ է դոկտորական աստիճան։ Ամենաշատը օգնում է հետևյալը.

Գրելու + խմբագրման նրբերանգներ - Հղկված, բայց բնական հնչողությամբ տեքստ [1]:
Վերլուծական մտածողություն ՝ մոդելի կրկնվող սխալների հայտնաբերում և ճշգրտումներ։
Մշակութային իրազեկություն - Իմանալ, թե երբ կարող է սխալ լինել բառակապակցությունը [2]:
Համբերություն , որովհետև արհեստական բանականությունը միանգամից չի ընկալվում։

Բոնուսային միավորներ բազմալեզու հմտությունների կամ մասնագիտացված գիտելիքների համար։

Որտեղ են մարզիչները ներկայանում 🌍

Այս աշխատանքը միայն չաթբոտների մասին չէ. այն ներթափանցում է բոլոր ոլորտներ։

Առողջապահություն - սահմանային դեպքերի համար ծանոթագրությունների գրման կանոններ (արձագանք առողջապահության արհեստական բանականության ուղեցույցում) [2]:
Ֆինանսներ - Խարդախության հայտնաբերման համակարգերի վերապատրաստում՝ առանց մարդկանց կեղծ տագնապների մեջ խեղդելու [2]:
Մանրածախ առևտուր - Դասավանդման օգնականներ՝ գնորդների ժարգոնային լեզու ստանալու համար՝ միաժամանակ պահպանելով ապրանքանիշի տոնը [5]:
Կրթություն - Ուսուցման բոտերի ձևավորումը՝ խրախուսական լինելու փոխարեն հովանավորչական լինելու [5]:

Հիմնականում. եթե արհեստական բանականությունը տեղ ունի սեղանի շուրջ, ապա ֆոնին մարզիչ է թաքնված։

Էթիկայի մաս (չի կարելի բաց թողնել սա)

Ահա թե որտեղ է այն դառնում կարևոր։ Անվերահսկելի մնալով՝ արհեստական բանականությունը կրկնում է կարծրատիպերը, սխալ տեղեկատվությունը կամ ավելի վատ բաներ։ Մարզիչները կանխում են դա՝ օգտագործելով RLHF-ի կամ սահմանադրական կանոնների նման մեթոդներ, որոնք մոդելներին ուղղորդում են դեպի օգտակար, անվնաս պատասխաններ [1][5]:

Օրինակ՝ եթե բոտը կողմնակալ աշխատանքային առաջարկություններ է անում, մարզիչը նշում է դա, վերաշարադրում է կանոնների ցանկը և համոզվում, որ դա այլևս չի կրկնվի։ Սա գործողության մեջ անտեսում է [2]:

Ոչ այնքան զվարճալի կողմը

Ամեն ինչ այդքան էլ փայլուն չէ։ Մարզիչները զբաղվում են հետևյալ հարցերով.

Միապաղաղություն - Անվերջ պիտակավորումը հնանում է:
Զգացմունքային հոգնածություն - վնասակար կամ անհանգստացնող բովանդակության վերանայումը կարող է հետևանքներ ունենալ. աջակցության համակարգերը կարևոր դեր են խաղում [4]:
Ճանաչման պակաս - Օգտատերերը հազվադեպ են գիտակցում մարզիչների գոյության մասին:
Անընդհատ փոփոխություն - Գործիքները անընդհատ զարգանում են, ինչը նշանակում է, որ մարզիչները պետք է համընթաց քայլեն։

Այնուամենայնիվ, շատերի համար տեխնոլոգիաների «ուղեղները» ձևավորելու հուզմունքը նրանց կախվածության մեջ է պահում։

Արհեստական բանականության թաքնված MVP-ները

Այսպիսով, ովքե՞ր են արհեստական բանականության մարզիչները: Նրանք կամուրջ են հում ալգորիթմների և իրականում աշխատող : Առանց նրանց արհեստական բանականությունը կլիներ գրադարանի նման՝ առանց գրադարանավարների՝ տոննաներով տեղեկատվություն, բայց գրեթե անհնար է օգտագործել:

Հաջորդ անգամ, երբ չաթբոտը ձեզ ծիծաղեցնի կամ զարմանալիորեն «համաձայնության մեջ» զգաք, շնորհակալություն հայտնեք մարզչին։ Նրանք լուռ կերպարներ են, որոնք մեքենաները դարձնում են ոչ միայն հաշվարկներ, այլև կապակցված [1][2][5]:

Հղումներ

[1] Օույանգ, Լ. և այլք (2022): Լեզվական մոդելների վարժեցում՝ մարդկային հետադարձ կապի միջոցով հրահանգներին հետևելու համար (InstructGPT): NeurIPS: Հղում

[2] NIST (2023): Արհեստական բանականության ռիսկերի կառավարման շրջանակ (AI RMF 1.0): Հղում

[3] Նորթքաթ, Ք. և այլք (2021): Փորձարկման հավաքածուներում տարածված պիտակների սխալները անկայունացնում են մեքենայական ուսուցման չափանիշները: NeurIPS տվյալների հավաքածուներ և չափանիշներ: Հղում

[4] ԱՀԿ/ԱՄԿ (2022): Աշխատանքի վայրում հոգեկան առողջության վերաբերյալ ուղեցույցներ: Հղում

[5] Բայ, Յ. և այլք (2022): Կոնստիտուցիոնալ արհեստական ինտելեկտ. Արհեստական ինտելեկտի հետադարձ կապից անվնասություն: arXiv. Հղում

Գտեք արհեստական բանականության վերջին նորույթները պաշտոնական արհեստական բանականության օգնականների խանութում

Մեր մասին

Վերադառնալ բլոգ

Երկիր/տարածաշրջան

Ի՞նչն է դարձնում արհեստական ​​բանականության մարզիչը լավը։ 🏆

Արհեստական ​​բանականության մարզչի դերերի համառոտ ակնարկ (որոշ առանձնահատկություններով 😉)

Մի օր արհեստական ​​ինտելեկտի մարզչի կյանքից