Ի՞նչ է արհեստական ​​բանականության մարզիչը։

Ի՞նչ է արհեստական ​​բանականության մարզիչը։

Արհեստական ​​բանականությունը երբեմն գրեթե կախարդական հնարքի է նման։ Դուք պատահական հարց եք գրում, և բամ՝ վայրկյանների ընթացքում հայտնվում է հղկված, հղկված պատասխան։ Բայց ահա թե ինչն է խնդիրը. յուրաքանչյուր «հանճարեղ» մեքենայի հետևում կան իրական մարդիկ, որոնք ճանապարհին հրում, ուղղում և ձևավորում են այն։ Այդ մարդկանց անվանում են արհեստական ​​բանականության մարզիչներ , և նրանց կատարած աշխատանքն ավելի տարօրինակ է, ավելի զվարճալի և, անկեղծ ասած, ավելի մարդկային, քան մարդկանց մեծ մասը կարծում է։

Եկեք քննարկենք, թե ինչու են այս մարզիչները կարևոր, ինչպիսին է նրանց առօրյան և ինչու է այս դերը ավելի արագ զարգանում, քան որևէ մեկը կանխատեսում էր։

Հոդվածներ, որոնք կարող են ձեզ դուր գալ կարդալ սրանից հետո.

🔗 Ի՞նչ է արհեստական ​​բանականության արբիտրաժը. այս տարածված բառի հետևում կանգնած ճշմարտությունը
Բացատրում է արհեստական ​​բանականության արբիտրաժը, դրա ռիսկերը, օգուտները և տարածված թյուրըմբռնումները։

🔗 Արհեստական ​​բանականության տվյալների պահպանման պահանջները. Ինչ դուք իսկապես պետք է իմանաք
Ծածկում է արհեստական ​​բանականության համակարգերի պահեստավորման կարիքները, մասշտաբայնությունը և արդյունավետությունը։

🔗 Ո՞վ է արհեստական ​​բանականության հայրը։
Ուսումնասիրում է արհեստական ​​բանականության ռահվիրաներին և արհեստական ​​բանականության ծագումը։


Ի՞նչն է դարձնում արհեստական ​​բանականության մարզիչը լավը։ 🏆

Սա կոճակ սեղմելու աշխատանք չէ։ Լավագույն մարզիչները հենվում են տաղանդների բավականին տարօրինակ խառնուրդի վրա.

  • Համբերություն (շատ) - Մոդելները միանգամից չեն սովորում: Մարզիչները շարունակում են նույն ուղղումները կատարել, մինչև դրանք համոզվեն:

  • Նրբերանգի նկատում - Մարդկային հետադարձ կապի առավելությունը սարկազմի, մշակութային համատեքստի կամ կողմնակալության նկատումն է [1]:

  • Պարզ հաղորդակցություն - Աշխատանքի կեսը հստակ հրահանգներ գրելն է, որոնք արհեստական ​​բանականությունը չի կարող սխալ կարդալ:

  • Հետաքրքրասիրություն + էթիկա - Լավ մարզիչը կասկածի տակ է դնում պատասխանի «փաստորեն ճիշտ» լինելը, բայց սոցիալապես անտարբեր է. սա արհեստական ​​բանականության վերահսկողության հիմնական թեման է [2]:

Պարզ ասած՝ մարզիչը մասամբ ուսուցիչ է, մասամբ խմբագիր և մի փոքր էլ էթիկայի մասնագետ։


Արհեստական ​​բանականության մարզչի դերերի համառոտ ակնարկ (որոշ առանձնահատկություններով 😉)

Դերի տեսակը Ո՞վ է ամենից շատ համապատասխանում Տիպիկ վճար Ինչու է այն աշխատում (կամ չի աշխատում)
Տվյալների պիտակավորիչ Մարդիկ, ովքեր սիրում են մանրուքները Ցածր-միջին $$ Անկասկած կարևոր է. եթե պիտակները անփույթ են, ամբողջ մոդելը կտուժի [3] 📊
RLHF մասնագետ Գրողներ, խմբագիրներ, վերլուծաբաններ Միջին-բարձր $$ Դասակարգում և վերաշարադրում է պատասխանները՝ համապատասխանեցնելով տոնը և պարզությունը մարդկային սպասումներին [1]
Դոմեյնի մարզիչ Իրավաբաններ, բժիշկներ, փորձագետներ Ամբողջ քարտեզի վրա 💼 Աշխատում է նիշային տերմինաբանության և արդյունաբերական համակարգերի համար նախատեսված եզրային օրինակների հետ
Անվտանգության գնահատող Էթիկայի հետևորդ մարդիկ Միջին $$ Կիրառում է ուղեցույցներ, որպեսզի արհեստական ​​բանականությունը խուսափի վնասակար բովանդակությունից [2][5]
Ստեղծագործական մարզիչ Նկարիչներ, պատմողներ Անկանխատեսելի 💡 Օգնում է արհեստական ​​բանականությանը արտացոլել երևակայությունը՝ մնալով անվտանգ սահմաններում [5]

(Այո, ձևաչափումը մի փոքր խառնաշփոթ է՝ մի փոքր նման է աշխատանքին):


Մի օր արհեստական ​​ինտելեկտի մարզչի կյանքից

Այսպիսով, ինչպիսի՞ն է իրական աշխատանքը։ Պատկերացրեք ավելի քիչ շքեղ կոդավորում և ավելին։

  • Արհեստական ​​բանականության կողմից գրված պատասխանների դասակարգում վատագույնից լավագույնը (դասական RLHF քայլ) [1]:

  • Խճճվածքների շտկում (օրինակ՝ երբ մոդելը մոռանում է, որ Վեներան Մարս չէ):

  • Վերաշարադրել չաթբոտի պատասխանները, որպեսզի դրանք ավելի բնական հնչեն։

  • Տեքստի, պատկերների կամ աուդիոյի լեռերի պիտակավորում՝ որտեղ ճշգրտությունն իսկապես կարևոր է [3]:

  • Քննարկումներ այն մասին, թե արդյոք «տեխնիկապես ճիշտը» բավարար է, թե՞ անվտանգության ուղեցույցները պետք է գերակշռեն [2]:

Մասամբ ձանձրալի է, մասամբ՝ հանելուկ։ Անկեղծ ասած, պատկերացրեք, որ թութակին սովորեցնում եք ոչ միայն խոսել, այլև մի փոքր սխալ բառեր չօգտագործել. սա է մթնոլորտը։ 🦜


Ինչու են մարզիչները շատ ավելի կարևոր, քան դուք կարծում եք

Առանց մարդկանց կառավարման, արհեստական ​​բանականությունը կանի հետևյալը՝

  • Հնչում է կոշտ և ռոբոտիկ։

  • Անվերահսկելի կողմնակալության տարածում (սարսափելի միտք):

  • Ամբողջովին կարոտում եմ հումորը կամ կարեկցանքը։

  • Ավելի քիչ անվտանգ եղեք զգայուն իրավիճակներում։

Մարզիչներն են, ովքեր ներթափանցում են «անկարգ մարդկային բաների» մեջ՝ ժարգոն, ջերմություն, երբեմն-երբեմն անհարմար փոխաբերություն, միաժամանակ պաշտպանիչ ցանկապատեր կիրառելով՝ իրերը անվտանգ պահելու համար [2][5]:


Հմտություններ, որոնք իրականում կարևոր են

Մոռացեք այն առասպելը, որ ձեզ անհրաժեշտ է դոկտորական աստիճան։ Ամենաշատը օգնում է հետևյալը.

  • Գրելու + խմբագրման նրբերանգներ - Հղկված, բայց բնական հնչողությամբ տեքստ [1]:

  • Վերլուծական մտածողություն ՝ մոդելի կրկնվող սխալների հայտնաբերում և ճշգրտումներ։

  • Մշակութային իրազեկություն - Իմանալ, թե երբ կարող է սխալ լինել բառակապակցությունը [2]:

  • Համբերություն , որովհետև արհեստական ​​բանականությունը միանգամից չի ընկալվում։

Բոնուսային միավորներ բազմալեզու հմտությունների կամ մասնագիտացված գիտելիքների համար։


Որտեղ են մարզիչները ներկայանում 🌍

Այս աշխատանքը միայն չաթբոտների մասին չէ. այն ներթափանցում է բոլոր ոլորտներ։

  • Առողջապահություն - սահմանային դեպքերի համար ծանոթագրությունների գրման կանոններ (արձագանք առողջապահության արհեստական ​​բանականության ուղեցույցում) [2]:

  • Ֆինանսներ - Խարդախության հայտնաբերման համակարգերի վերապատրաստում՝ առանց մարդկանց կեղծ տագնապների մեջ խեղդելու [2]:

  • Մանրածախ առևտուր - Դասավանդման օգնականներ՝ գնորդների ժարգոնային լեզու ստանալու համար՝ միաժամանակ պահպանելով ապրանքանիշի տոնը [5]:

  • Կրթություն - Ուսուցման բոտերի ձևավորումը՝ խրախուսական լինելու փոխարեն հովանավորչական լինելու [5]:

Հիմնականում. եթե արհեստական ​​բանականությունը տեղ ունի սեղանի շուրջ, ապա ֆոնին մարզիչ է թաքնված։


Էթիկայի մաս (չի կարելի բաց թողնել սա)

Ահա թե որտեղ է այն դառնում կարևոր։ Անվերահսկելի մնալով՝ արհեստական ​​բանականությունը կրկնում է կարծրատիպերը, սխալ տեղեկատվությունը կամ ավելի վատ բաներ։ Մարզիչները կանխում են դա՝ օգտագործելով RLHF-ի կամ սահմանադրական կանոնների նման մեթոդներ, որոնք մոդելներին ուղղորդում են դեպի օգտակար, անվնաս պատասխաններ [1][5]:

Օրինակ՝ եթե բոտը կողմնակալ աշխատանքային առաջարկություններ է անում, մարզիչը նշում է դա, վերաշարադրում է կանոնների ցանկը և համոզվում, որ դա այլևս չի կրկնվի։ Սա գործողության մեջ անտեսում է [2]:


Ոչ այնքան զվարճալի կողմը

Ամեն ինչ այդքան էլ փայլուն չէ։ Մարզիչները զբաղվում են հետևյալ հարցերով.

  • Միապաղաղություն - Անվերջ պիտակավորումը հնանում է:

  • Զգացմունքային հոգնածություն - վնասակար կամ անհանգստացնող բովանդակության վերանայումը կարող է հետևանքներ ունենալ. աջակցության համակարգերը կարևոր դեր են խաղում [4]:

  • Ճանաչման պակաս - Օգտատերերը հազվադեպ են գիտակցում մարզիչների գոյության մասին:

  • Անընդհատ փոփոխություն - Գործիքները անընդհատ զարգանում են, ինչը նշանակում է, որ մարզիչները պետք է համընթաց քայլեն։

Այնուամենայնիվ, շատերի համար տեխնոլոգիաների «ուղեղները» ձևավորելու հուզմունքը նրանց կախվածության մեջ է պահում։


Արհեստական ​​բանականության թաքնված MVP-ները

Այսպիսով, ովքե՞ր են արհեստական ​​բանականության մարզիչները: Նրանք կամուրջ են հում ալգորիթմների և իրականում աշխատող : Առանց նրանց արհեստական ​​բանականությունը կլիներ գրադարանի նման՝ առանց գրադարանավարների՝ տոննաներով տեղեկատվություն, բայց գրեթե անհնար է օգտագործել:

Հաջորդ անգամ, երբ չաթբոտը ձեզ ծիծաղեցնի կամ զարմանալիորեն «համաձայնության մեջ» զգաք, շնորհակալություն հայտնեք մարզչին։ Նրանք լուռ կերպարներ են, որոնք մեքենաները դարձնում են ոչ միայն հաշվարկներ, այլև կապակցված [1][2][5]:


Հղումներ

[1] Օույանգ, Լ. և այլք (2022): Լեզվական մոդելների վարժեցում՝ մարդկային հետադարձ կապի միջոցով հրահանգներին հետևելու համար (InstructGPT): NeurIPS: Հղում

[2] NIST (2023): Արհեստական ​​բանականության ռիսկերի կառավարման շրջանակ (AI RMF 1.0): Հղում

[3] Նորթքաթ, Ք. և այլք (2021): Փորձարկման հավաքածուներում տարածված պիտակների սխալները անկայունացնում են մեքենայական ուսուցման չափանիշները: NeurIPS տվյալների հավաքածուներ և չափանիշներ: Հղում

[4] ԱՀԿ/ԱՄԿ (2022): Աշխատանքի վայրում հոգեկան առողջության վերաբերյալ ուղեցույցներ: Հղում

[5] Բայ, Յ. և այլք (2022): Կոնստիտուցիոնալ արհեստական ​​ինտելեկտ. Արհեստական ​​ինտելեկտի հետադարձ կապից անվնասություն: arXiv. Հղում


Գտեք արհեստական ​​բանականության վերջին նորույթները պաշտոնական արհեստական ​​բանականության օգնականների խանութում

Մեր մասին

Վերադառնալ բլոգ