«Բացատրելի արհեստական բանականությունը» այն արտահայտություններից մեկն է, որը հիանալի է հնչում ընթրիքի ժամանակ և դառնում է կենսականորեն կարևոր այն պահին, երբ ալգորիթմը հրում է բժշկական ախտորոշում, հաստատում վարկ կամ նշում է առաքման մասին: Եթե երբևէ մտածել եք՝ լավ, բայց ինչո՞ւ է մոդելը դա արել… դուք արդեն գտնվում եք «Բացատրելի արհեստական բանականության» տարածքում: Եկեք բացատրենք գաղափարը պարզ լեզվով՝ ոչ մի կախարդանք, միայն մեթոդներ, փոխզիջումներ և մի քանի դառը ճշմարտություններ:
Հոդվածներ, որոնք կարող են ձեզ դուր գալ կարդալ սրանից հետո.
🔗 Ի՞նչ է արհեստական բանականության կողմնակալությունը։
Հասկացեք արհեստական բանականության կողմնակալությունը, դրա աղբյուրները, ազդեցությունը և մեղմացման ռազմավարությունները։
🔗 Ի՞նչ է կանխատեսող արհեստական բանականությունը։
Ուսումնասիրեք կանխատեսող արհեստական բանականությունը, դրա տարածված կիրառությունները, առավելությունները և գործնական սահմանափակումները։
🔗 Ի՞նչ է մարդանման ռոբոտի արհեստական բանականությունը։
Իմացեք, թե ինչպես է արհեստական բանականությունը հզորացնում մարդանման ռոբոտներին, նրանց հնարավորությունները, օրինակները և մարտահրավերները։
🔗 Ի՞նչ է արհեստական բանականության մարզիչը։
Բացահայտեք, թե ինչ են անում արհեստական բանականության մարզիչները, պահանջվող հմտությունները և կարիերայի ուղիները։
Ի՞նչ է իրականում նշանակում բացատրելի արհեստական բանականությունը
Բացատրելի արհեստական բանականությունը արհեստական բանականության համակարգերի նախագծման և օգտագործման պրակտիկա է, որպեսզի դրանց արդյունքները հասկանալի լինեն մարդկանց՝ որոշումների ազդեցության տակ գտնվող կամ դրանց համար պատասխանատու կոնկրետ մարդկանց, այլ ոչ թե միայն մաթեմատիկոսների կողմից։ NIST-ը սա բաժանում է չորս սկզբունքների՝ տալ բացատրություն , դարձնել այն իմաստալից լսարանի համար, ապահովել բացատրության ճշգրտությունը (հավատարիմ մոդելին) և հարգել գիտելիքների սահմանները (չգերագնահատել համակարգի իմացածը) [1]:
Կարճ պատմական ակնարկ. անվտանգության համար կարևորագույն ոլորտները վաղուց են առաջ քաշվել՝ նպատակ ունենալով ստեղծել մոդելներ, որոնք կմնան ճշգրիտ, բայց միևնույն ժամանակ բավականաչափ մեկնաբանելի՝ «ցիկլի մեջ վստահելու» համար: Հյուսիսային աստղը չի փոխել օգտագործելի բացատրությունները ՝ առանց վատթարացնելու կատարողականությունը:
Ինչու է բացատրելի արհեստական բանականությունը ավելի կարևոր, քան դուք կարծում եք 💡
-
Վստահություն և ընդունում - Մարդիկ ընդունում են համակարգեր, որոնցում կարող են հարցումներ կատարել, հարցեր տալ և ուղղել։
-
Ռիսկ և անվտանգություն - բացատրություններ մակերեսային ձախողման ռեժիմների մասին, նախքան դրանք ձեզ զարմացնեն մասշտաբով։
-
Կարգավորող սպասումներ - ԵՄ-ում արհեստական բանականության մասին օրենքը սահմանում է թափանցիկության հստակ պարտականություններ, օրինակ՝ մարդկանց տեղեկացնել, թե երբ են նրանք որոշակի համատեքստերում փոխազդում արհեստական բանականության հետ և համապատասխանաբար պիտակավորել արհեստական բանականության կողմից ստեղծված կամ մանիպուլացված բովանդակությունը [2]:
Եկեք անկեղծ լինենք. գեղեցիկ վահանակները բացատրություններ չեն։ Լավ բացատրությունը օգնում է մարդուն որոշել, թե ինչ անել հաջորդը։
Ի՞նչն է Explainable AI-ը դարձնում օգտակար ✅
Երբ գնահատում եք որևէ XAI մեթոդ, հարցրեք.
-
Հավատարմություն - Արդյո՞ք բացատրությունը արտացոլում է մոդելի վարքագիծը, թե՞ պարզապես պատմում է մխիթարական պատմություն:
-
Օգտակարություն լսարանի համար . տվյալագետները ցանկանում են գրադիենտներ, կլինիցիստները՝ հակափաստեր կամ կանոններ, իսկ հաճախորդները՝ պարզ լեզվով հիմնավորումներ և հաջորդ քայլեր։
-
Կայունություն - Փոքրիկ մուտքային փոփոխությունները չպետք է պատմությունը A-ից Z շրջեն։
-
Գործողության հնարավորություն - Եթե արդյունքը անցանկալի է, ի՞նչ կարող էր փոխվել։
-
Անկեղծություն անորոշության վերաբերյալ . Բացատրությունները պետք է բացահայտեն սահմանները, այլ ոչ թե ներկեն դրանք։
-
Շրջանակի պարզություն . սա մեկ կանխատեսման տեղական մոդելի վարքագծի գլոբալ
Եթե միայն մեկ բան հիշեք. օգտակար բացատրությունը փոխում է մարդու որոշումը, ոչ միայն տրամադրությունը։
Հիմնական հասկացություններ, որոնք շատ կլսեք 🧩
-
Մեկնաբանելիությունն ընդդեմ բացատրելիության - Մեկնաբանելիություն. մոդելը բավականաչափ պարզ է կարդալու համար (օրինակ՝ փոքր ծառ): Բացատրելիություն. վերևում ավելացրեք մեթոդ՝ բարդ մոդելը ընթեռնելի դարձնելու համար:
-
Տեղականն ընդդեմ գլոբալի - Տեղականը բացատրում է մեկ որոշում, իսկ գլոբալը՝ ընդհանուր առմամբ ամփոփում է վարքագիծը։
-
Հետհոկ vs ներքին - Հետհոկը բացատրում է մարզված սև արկղը. ներքինը օգտագործում է բնույթով մեկնաբանելի մոդելներ։
Այո՛, այս սահմանները մշուշոտ են։ Դա նորմալ է. լեզուն զարգանում է, իսկ ռիսկերի գրանցամատյանը՝ ոչ։
Հայտնի բացատրելի արհեստական ինտելեկտի մեթոդներ - շրջագայություն 🎡
Ահա մի մրրիկ շրջագայություն՝ թանգարանի աուդիոուղեցույցի մթնոլորտով, բայց ավելի կարճ։
1) Հավելյալ հատկանիշների վերագրումներ
-
SHAP - Խաղերի տեսության գաղափարների միջոցով յուրաքանչյուր առանձնահատկությանը վերագրում է որոշակի կանխատեսման մեջ ներդրում: Սիրված է հստակ հավելյալ բացատրությունների և մոդելների միջև միասնական տեսակետի համար [3]:
2) Տեղական փոխարինող մոդելներ
-
LIME - Պատրաստում է պարզ, տեղային մոդել՝ բացատրվող օրինակի շուրջ: Արագ, մարդու համար ընթեռնելի ամփոփումներ այն մասին, թե որ հատկանիշներն են կարևոր մոտակայքում: Հիանալի է ցուցադրությունների համար, օգտակար է մարզումների և դիտումների կայունության համար [4]:
3) Գրադիենտային մեթոդներ խորը ցանցերի համար
-
Ինտեգրված գրադիենտներ - Կարևորություն է հաղորդում՝ ինտեգրելով գրադիենտները բազային գծից մինչև մուտքային տվյալները։ Հաճախ օգտագործվում է տեսողական և տեքստային տվյալների համար։ Խելամիտ աքսիոմներ. անհրաժեշտ է զգուշություն բազային գծերի և աղմուկի հետ [1]:
4) Օրինակների վրա հիմնված բացատրություններ
-
Հակափաստեր - «Ի՞նչ նվազագույն փոփոխություն կարող էր փոխել արդյունքը»: Հիանալի է որոշումների կայացման համար, քանի որ դա բնականաբար կիրառելի է. արեք X՝ Y ստանալու համար [1]:
5) Նախատիպեր, կանոններ և մասնակի կախվածություն
-
Նախատիպերը ցույց են տալիս ներկայացուցչական օրինակներ. կանոնները արտացոլում են այնպիսի օրինաչափություններ, ինչպիսիք են ՝ եթե եկամուտը > X և պատմությունը = մաքուր, ապա հաստատված . մասնակի կախվածությունը ցույց է տալիս հատկանիշի միջին ազդեցությունը որոշակի տիրույթում: Պարզ գաղափարներ, որոնք հաճախ թերագնահատված են:
6) Լեզվական մոդելների համար
-
Թոքենների/տարածքների վերագրումներ, վերցված օրինակներ և կառուցվածքային հիմնավորումներ։ Օգտակար է, սովորական նախազգուշացմամբ. կոկիկ ջերմային քարտեզները չեն երաշխավորում պատճառահետևանքային դատողությունը [5]:
Արագ (համակցված) դեպք դաշտից 🧪
Միջին չափի վարկատուն ներկայացնում է վարկային որոշումների կայացման համար գրադիենտային ուժեղացված մոդել: Տեղական SHAP-ը օգնում է գործակալներին բացատրել անբարենպաստ արդյունքը («Պարտքի և եկամտի հարաբերակցությունը և վարկի վերջին օգտագործումը հիմնական շարժիչ ուժերն էին») [3]: Հակափաստական շերտը ենթադրում է իրագործելի միջոցառում («Նվազեցրեք շրջանառու միջոցների օգտագործումը մոտ 10%-ով կամ ավելացրեք 1,500 ֆունտ ստեռլինգ ստուգված ավանդներ՝ որոշումը փոխելու համար») [1]: Ներքին մակարդակով թիմը պատահականացման թեստեր որակի ապահովման մեջ օգտագործվող կարևորության ոճի տեսողական նյութերի վրա՝ համոզվելու համար, որ կարևորագույն կետերը պարզապես քողարկված եզրային դետեկտորներ չեն [5]: Նույն մոդելը, տարբեր բացատրություններ տարբեր լսարանների համար՝ հաճախորդներ, օպերատորներ և աուդիտորներ:
Անհարմար մասը. բացատրությունները կարող են մոլորեցնել 🙃
Որոշ ակնառու մեթոդներ համոզիչ են թվում նույնիսկ այն դեպքում, երբ դրանք կապված չեն մարզված մոդելի կամ տվյալների հետ: Առողջության ստուգումները ցույց են տվել, որ որոշակի մեթոդներ կարող են ձախողել հիմնական թեստերը՝ տալով սխալ հասկացողություն: Թարգմանություն՝ գեղեցիկ նկարները կարող են լինել մաքուր թատրոն: Ձեր բացատրական մեթոդների համար ներառեք վավերացման թեստեր [5]:
Նաև, նոսր ≠ անկեղծ։ Մեկ նախադասությունից բաղկացած պատճառը կարող է թաքցնել մեծ փոխազդեցությունները։ Բացատրության մեջ աննշան հակասությունները կարող են ազդարարել իրական մոդելի անորոշության կամ պարզապես աղմուկի մասին։ Ձեր աշխատանքն է ասել, թե որն է որը։
Կառավարում, քաղաքականություն և թափանցիկության բարձրացող չափանիշ 🏛️
Քաղաքականության մշակողները ակնկալում են համատեքստին համապատասխան թափանցիկություն: ԵՄ-ում « Արհեստական բանականության մասին» օրենքը սահմանում է այնպիսի պարտավորություններ, ինչպիսիք են՝ մարդկանց տեղեկացնելը, երբ նրանք փոխազդում են արհեստական բանականության հետ որոշակի դեպքերում, և արհեստական բանականության կողմից ստեղծված կամ մանիպուլացված բովանդակության պիտակավորումը համապատասխան ծանուցումներով և տեխնիկական միջոցներով՝ բացառություններով (օրինակ՝ օրինական օգտագործում կամ պաշտպանված արտահայտություն) [2]: Ինժեներական առումով, NIST-ը տրամադրում է սկզբունքներին ուղղված ուղեցույց՝ օգնելու թիմերին մշակել բացատրություններ, որոնք մարդիկ կարող են իրականում օգտագործել [1]:
Ինչպես ընտրել բացատրելի արհեստական բանականության մոտեցում՝ արագ քարտեզ 🗺️
-
Սկսե՛ք որոշումից ՝ ո՞ւմ է պետք բացատրությունը և ի՞նչ գործողության համար։
-
Համապատասխանեցրեք մեթոդը մոդելին և միջավայրին
-
Գրադիենտային մեթոդներ տեսողության կամ NLP-ի խորը ցանցերի համար [1]:
-
SHAP կամ LIME աղյուսակային մոդելների համար, երբ ձեզ անհրաժեշտ են հատկանիշների վերագրումներ [3][4]:
-
Հակափաստարկներ հաճախորդների հետ շփման մեջ գտնվող խնդիրների լուծման և բողոքարկումների համար [1]:
-
-
Որակի դարպասների հավաքածու - Հավաստիության ստուգումներ, կայունության թեստեր և մարդկային կապի վերլուծություններ [5]:
-
Մակարդակի պլան - Բացատրությունները պետք է լինեն գրանցելի, ստուգելի և աուդիտի ենթակա։
-
Փաստաթղթավորեք սահմանափակումները . Ոչ մի մեթոդ կատարյալ չէ. գրեք հայտնի ձախողման ռեժիմները։
Փոքրիկ մի փոքր նշենք. եթե չեք կարող ստուգել բացատրությունները այնպես, ինչպես փորձարկում եք մոդելները, հնարավոր է, որ բացատրություններ չունենաք, միայն տպավորություններ։
Համեմատական աղյուսակ - Բացատրելի արհեստական ինտելեկտի ընդհանուր տարբերակներ 🧮
Միտումնավոր մի փոքր տարօրինակ է, իրական կյանքը խառնաշփոթ է։
| Գործիք / մեթոդ | Լավագույն լսարանը | Գինը | Ինչու է դա աշխատում նրանց համար |
|---|---|---|---|
| ՇԱՊ | Տվյալների գիտնականներ, աուդիտորներ | Անվճար/բաց | Հավելյալ վերագրումներ՝ համապատասխան, համեմատելի [3]: |
| ԼԱՅՄ | Արտադրանքի թիմեր, վերլուծաբաններ | Անվճար/բաց | Արագ տեղական փոխարինիչներ, հեշտ է որոնել, երբեմն աղմկոտ [4]: |
| Ինտեգրված գրադիենտներ | ML ինժեներներ խորը ցանցերում | Անվճար/բաց | Գրադիենտային վերագրումներ՝ խելամիտ աքսիոմներով [1]: |
| Հակափաստարկներ | Վերջնական օգտատերեր, համապատասխանություն, գործողություններ | Խառը | Անմիջապես պատասխանում է, թե ինչ պետք է փոխել. գերգործնական է [1]: |
| Կանոնների ցանկեր / Ծառեր | Ռիսկի սեփականատերեր, կառավարիչներ | Անվճար/բաց | Ներքին մեկնաբանելիություն; գլոբալ ամփոփումներ։ |
| Մասնակի կախվածություն | Մոդելների մշակողներ, որակի ստուգում | Անվճար/բաց | Վիզուալացնում է միջին էֆեկտները տարբեր տիրույթներում։ |
| Նախատիպեր և նմուշներ | Դիզայներներ, քննադատներ | Անվճար/բաց | Կոնկրետ, մարդու համար հարմար օրինակներ. կապելի։ |
| Գործիքավորման հարթակներ | Հարթակի թիմեր, կառավարում | Առևտրային | Մոնիթորինգ + բացատրություն + աուդիտ մեկ տեղում։ |
Այո՛, բջիջները անհարթ են։ Ահա թե ինչ է կյանքը։
Պարզ աշխատանքային հոսք՝ արտադրության մեջ բացատրելի արհեստական բանականության համար 🛠️
Քայլ 1 - Սահմանեք հարցը։
Որոշեք, թե ում կարիքներն են ամենակարևորը։ Տվյալների գիտնականի համար բացատրելիությունը նույնը չէ, ինչ հաճախորդին ուղղված բողոքարկման նամակը։
Քայլ 2 - Ընտրեք մեթոդը համատեքստից ելնելով։
-
Վարկերի համար աղյուսակային ռիսկի մոդել - սկսեք SHAP-ից տեղական և գլոբալի համար, ավելացրեք հակափաստարկներ՝ հետադարձ օգնության համար [3][1]:
-
Տեսողության դասակարգիչ - օգտագործեք ինտեգրված գրադիենտներ կամ նմանատիպ մեթոդներ. ավելացրեք առողջ բանականության ստուգումներ՝ ակնառուության թակարդներից խուսափելու համար [1][5]:
Քայլ 3 - Հաստատեք բացատրությունները:
Կատարեք բացատրությունների համապատասխանության թեստեր, խանգարեք մուտքագրված տվյալներին, ստուգեք, որ կարևոր հատկանիշները համապատասխանում են ոլորտի գիտելիքներին: Եթե ձեր հիմնական հատկանիշները կտրուկ շեղվում են յուրաքանչյուր վերապատրաստումից հետո, դադարեցրեք:
Քայլ 4 - Բացատրությունները դարձրեք օգտագործելի:
Պարզ լեզվով հիմնավորումներ՝ գծապատկերների կողքին: Ներառեք հաջորդ լավագույն գործողությունները: Առաջարկեք հղումներ՝ արդյունքները վիճարկելու համար, որտեղ դա նպատակահարմար է. սա հենց այն է, ինչ թափանցիկության կանոնները նպատակ ունեն աջակցել [2]:
Քայլ 5 - Հետևեք և գրանցեք
բացատրությունների կայունությունը ժամանակի ընթացքում: Մոլորեցնող բացատրությունները ռիսկի ազդանշան են, այլ ոչ թե կոսմետիկ թերություն:
Խորը վերլուծություն 1. Տեղական ընդդեմ գլոբալ բացատրությունների գործնականում 🔍
-
«Տեղականը» օգնում է անձին հասկանալ, թե ինչու իր գործը ստացել այդ որոշումը, ինչը կարևոր է զգայուն համատեքստերում։
-
Global-ը օգնում է ձեր թիմին ապահովել, որ մոդելի սովորած վարքագիծը համապատասխանի քաղաքականությանը և ոլորտի գիտելիքներին։
Անեք երկուսն էլ։ Կարող եք սկսել տեղական մակարդակով ծառայությունների մատուցման համար, այնուհետև ավելացնել գլոբալ մոնիթորինգ՝ շեղման և արդարության վերանայման համար։
Խորը վերլուծություն 2. Հակափաստարկներ բողոքարկման և վերաքննիչ բողոքների համար 🔄
Մարդիկ ուզում են իմանալ նվազագույն փոփոխությունը՝ ավելի լավ արդյունքի հասնելու համար: Հակափաստական բացատրությունները հենց դա են անում՝ փոխում են այս կոնկրետ գործոնները, և արդյունքը փոխվում է [1]: Զգուշացե՛ք. հակափաստականները պետք է հաշվի առնեն իրագործելիության և արդարության սկզբունքները: Անփոփոխ ատրիբուտը փոխելու համար ինչ-որ մեկին հրահանգելը պլան չէ, այլ կարմիր դրոշ:
Խորը վերլուծություն 3. Առողջության ստուգում 🧪
Եթե օգտագործում եք ակնառուության քարտեզներ կամ գրադիենտներ, կատարեք առողջ բանականության ստուգումներ: Որոշ տեխնիկաներ ստեղծում են գրեթե նույնական քարտեզներ, նույնիսկ երբ դուք պատահականացնում եք մոդելի պարամետրերը, ինչը նշանակում է, որ դրանք կարող են ընդգծել եզրեր և հյուսվածքներ, այլ ոչ թե ձեռք բերված ապացույցներ: Հիասքանչ ջերմային քարտեզներ, մոլորեցնող պատմություն: Կառուցեք ավտոմատացված ստուգումներ CI/CD-ում [5]:
Հաճախակի տրվող հարցեր, որոնք ի հայտ են գալիս յուրաքանչյուր հանդիպման ժամանակ 🤓
Հարց. Բացատրելի արհեստական բանականությունը նույնն է, ինչ արդարությունը:
Պատասխան. Ոչ: Բացատրությունները օգնում են տեսնել վարքագիծը. արդարությունը հատկություն է, որը դուք պետք է փորձարկեք և կիրառեք : Կապակցված է, ոչ թե նույնական:
Հարց. Արդյո՞ք պարզ մոդելները միշտ ավելի լավն են:
Պատասխան. Երբեմն: Բայց պարզը և սխալը միևնույն է սխալ է: Ընտրեք ամենապարզ մոդելը, որը համապատասխանում է կատարողականի և կառավարման պահանջներին:
Հարց. Արդյո՞ք բացատրությունները կարտահոսեն մտավոր սեփականության մասին:
Պատասխան. Կարող են: Հաշվարկեք մանրամասները ըստ լսարանի և ռիսկի. փաստաթղթավորեք, թե ինչ եք բացահայտում և ինչու:
Հարց. Կարո՞ղ ենք պարզապես ցույց տալ առանձնահատկությունների կարևորությունը և ավարտել այն:
Պատասխան. Ոչ այնքան: Կարևորության սյուները, որոնք չունեն համատեքստ կամ ռեսուրս, զարդարանք են:
Չափազանց երկար, չկարդացած տարբերակ և եզրափակիչ դիտողություններ 🌯
Բացատրելի արհեստական բանականությունը (AI) մոդելի վարքագիծը հասկանալի և օգտակար դարձնելու ոլորտ է այն մարդկանց համար, ովքեր ապավինում են դրան: Լավագույն բացատրություններն ունեն ճշգրտություն, կայունություն և հստակ լսարան: SHAP, LIME, ինտեգրված գրադիենտներ և հակափաստարկներ նման մեթոդներն ունեն իրենց ուժեղ կողմերը. օգտագործեք դրանք միտումնավոր, խստորեն փորձարկեք և ներկայացրեք այնպիսի լեզվով, որի վրա մարդիկ կարող են գործել: Եվ հիշեք, որ սահուն տեսողականները կարող են թատրոն լինել. պահանջեք ապացույցներ, որոնք ձեր բացատրությունները արտացոլում են մոդելի իրական վարքագիծը: Ներդրեք բացատրելիությունը ձեր մոդելի կյանքի ցիկլում. դա փայլուն լրացում չէ, այլ ձեր պատասխանատու առաքման մի մասն է:
Անկեղծ ասած, դա մի փոքր նման է ձեր մոդելին ձայն տալուն։ Երբեմն այն մռմռում է, երբեմն չափազանցնում է, երբեմն ասում է հենց այն, ինչ դուք պետք է լսեիք։ Ձեր աշխատանքն է օգնել նրան ասել ճիշտ բանը, ճիշտ մարդուն, ճիշտ պահին։ Եվ ավելացրեք մեկ կամ երկու լավ պիտակ։ 🎯
Հղումներ
[1] NIST IR 8312 - Բացատրելի արհեստական բանականության չորս սկզբունքներ ։ Ստանդարտների և տեխնոլոգիաների ազգային ինստիտուտ։ Կարդալ ավելին
[2] Կանոնակարգ (ԵՄ) 2024/1689 - Արհեստական բանականության մասին օրենք (Պաշտոնական տեղեկագիր/EUR-Lex) : կարդալ ավելին
[3] Լունդբերգ և Լի (2017) - «Մոդելային կանխատեսումների մեկնաբանման միասնական մոտեցում»: arXiv. կարդալ ավելին
[4] Ռիբեյրո, Սինգհ և Գուեստրին (2016) - «Ինչո՞ւ պետք է վստահեմ ձեզ»։ Բացատրելով ցանկացած դասակարգչի կանխատեսումները։ arXiv. կարդալ ավելին
[5] Ադեբայո և այլք (2018) - «Հոգեբանական ստուգումներ կարևորության քարտեզների համար»: NeurIPS (թղթային PDF): կարդալ ավելին