Ինչպե՞ս կարող եմ ապահովել իմ արհեստական բանականության գործակալի նախագծի հաջողությունը։

Ձեր արհեստական բանականության գործակալի նախագծի հաջողությունն ապահովելու համար մեկ նախադասությամբ հստակ սահմանեք աշխատանքը և որոշեք ինքնավարության այն մակարդակը, որին դուք հարմարավետ եք զգում: Բացի այդ, կիրառեք գործիքային խիստ սխեմաներ, գրանցումների և վավերացման ռազմավարություններ՝ տարածված թերությունները կանխելու և խնդիրների ավելի լավ լուծում ապահովելու համար:.

Ի՞նչ պետք է հաշվի առնեմ իմ արհեստական բանականության գործակալի համար գործիքներ նախագծելիս։

Ձեր արհեստական բանականության գործակալի համար գործիքներ մշակելիս համոզվեք, որ դրանք նեղ ուշադրության կենտրոնում են, տպագրված են և ունեն թույլտվություններ: Խուսափեք ցանկացած գործողություն կատարելու համար նախատեսված ընդհանուր գործիքներից: Դրա փոխարեն ստեղծեք հատուկ ֆունկցիաների կանչեր, որոնք գործակալը կարող է օգտագործել անվտանգությունն ու հուսալիությունը պահպանելու համար:.

Ինչպե՞ս սահմանեմ իմ արհեստական ինտելեկտի գործակալի համար հստակ կանգնեցման պայմաններ։

Ձեր արհեստական ինտելեկտի գործակալի համար հստակ կանգառի պայմաններ սահմանելու համար սահմանեք քայլերի առավելագույն քանակը, որոնք նա կարող է ձեռնարկել, ինչպես նաև ժամկետանցները և ավարտի ստուգումները: Սա կօգնի կանխել գործակալի խրվելը ցիկլերի մեջ և ապահովել, որ անհրաժեշտության դեպքում նա կարողանա սրել խնդիրները:.

Ո՞րն է արհեստական բանականության գործակալի հիշողությունը կառավարելու լավագույն միջոցը։

Կառավարեք ձեր արհեստական բանականության գործակալի հիշողությունը՝ այն բաժանելով կարճաժամկետ և երկարաժամկետ բաղադրիչների: Պահպանեք կարճաժամկետ հիշողությունը կոմպակտ՝ կենտրոնանալով ընթացիկ քայլերի և ծրագրերի վրա, միաժամանակ օգտագործելով երկարաժամկետ հիշողությունը կայուն տեղեկատվության համար, ինչպիսիք են օգտատիրոջ նախասիրությունները և կազմակերպության կանոնները:.

Կա՞ն արհեստական բանականության գործակալի ներսում առաջադրանքների պլանավորման հատուկ օրինաչափություններ։

Այո, կարելի է օգտագործել պլանավորման տարբեր մոդելներ, ինչպիսիք են կանխատեսելի առաջադրանքների ստուգաթերթիկները, գործիքների արդյունքներին հարմարվողական արձագանքների համար նախատեսված ReAct ցիկլերը և բարդ նախագծերի համար դերերի բաժանումը հնարավոր դարձնող ղեկավար-աշխատող մոդելները: Ընտրեք պլանավորման մեթոդ՝ հիմնվելով ձեր գործակալի կոնկրետ պահանջների վրա:.

Ինչպե՞ս կարող եմ արդյունավետորեն գնահատել իմ արհեստական ինտելեկտի գործակալի աշխատանքը։

Ձեր արհեստական ինտելեկտի գործակալի աշխատանքը գնահատելու համար ստեղծեք սցենարների հավաքածու, որը ներառում է հաջող ուղիներ, եզրային դեպքեր և երկիմաստ հարցումներ: Գնահատեք արդյունքները՝ հիմնվելով այնպիսի չափանիշների վրա, ինչպիսիք են առաջադրանքի հաջողության մակարդակը, արձագանքման ժամանակը և սխալներից վերականգնումը՝ նրա հնարավորությունները անընդհատ բարելավելու համար:.

Ինչպես ստեղծել արհեստական բանականության գործակալ

Կարճ պատասխան. Գործնականում աշխատող արհեստական բանականության գործակալ կառուցելու համար այն դիտարկեք որպես կառավարվող ցիկլ. ընդունեք մուտքային տվյալները, որոշեք հաջորդ գործողությունը, կանչեք նեղ շրջանակով գործիք, դիտարկեք արդյունքը և կրկնեք մինչև «կատարված» հստակ ստուգումը հաջողվի: Այն արժանի է իր նպատակին, երբ խնդիրը բազմաքայլ է և գործիքակազմված. եթե մեկ հուշում է լուծում այն, բաց թողեք գործակալը: Ավելացրեք գործիքների խիստ սխեմաներ, քայլերի սահմանափակումներ, գրանցում և վավերացուցիչ/քննադատ, որպեսզի երբ գործիքները ձախողվեն կամ մուտքային տվյալները երկիմաստ լինեն, գործակալը սկսի գործել ցիկլի փոխարեն:

Հիմնական եզրակացություններ՝

Կառավարիչի ցիկլ. Իրականացնել մուտքագրում → գործել → դիտարկել կրկնությունը՝ հստակ կանգառի պայմաններով և առավելագույն քայլերով։

Գործիքների դիզայն. գործիքները պահեք նեղ, տպագրված, թույլատրված և վավերացված՝ «անել ամեն ինչ» քաոսը կանխելու համար։

Հիշողության հիգիենա. օգտագործեք կոմպակտ կարճաժամկետ վիճակ գումարած երկարաժամկետ վերականգնում. խուսափեք ամբողջական տրանսկրիպտները թափելուց։

Չարաշահման դիմադրություն. ավելացրեք թույլատրելի ցուցակներ, արագության սահմանափակումներ, նույնականություն և «չոր գործարկում» ռիսկային գործողությունների համար։

Փորձարկելիություն. Պահպանել սցենարների հավաքածու (ձախողումներ, անորոշություն, ներարկումներ) և վերագործարկել յուրաքանչյուր փոփոխության դեպքում։

Ինչպե՞ս ստեղծել արհեստական բանականության գործակալ։ Ինֆոգրաֆիկա

Հոդվածներ, որոնք կարող են ձեզ դուր գալ կարդալ սրանից հետո

🔗 Ինչպես չափել արհեստական բանականության արդյունավետությունը
Սովորեք գործնական չափանիշներ՝ արագությունը, ճշգրտությունը և հուսալիությունը չափելու համար։.

🔗 Ինչպես խոսել արհեստական բանականության հետ
Ավելի լավ պատասխաններ ստանալու համար օգտագործեք հուշումներ, համատեքստ և հետևություններ։.

🔗 Ինչպես գնահատել արհեստական բանականության մոդելները
Համեմատեք մոդելները՝ օգտագործելով թեստեր, չափանիշներ և իրական աշխարհի առաջադրանքների արդյունքներ։.

🔗 Ինչպես օպտիմալացնել արհեստական բանականության մոդելները
Բարելավեք որակը և արժեքը՝ կարգաբերելով, կտրելով և մոնիթորինգով։.

1) Ի՞նչ է արհեստական բանականության գործակալը՝ սովորական մարդու տեսանկյունից 🧠

Արհեստական բանականության գործակալը ցիկլ է։ LangChain-ի «Գործակալներ» փաստաթղթերը

Այսքանը։ Մի օղակ՝ մեջտեղում ուղեղով։.

Մուտքագրում → մտածել → գործել → դիտարկել → կրկնել։ ReAct թուղթ (պատճառաբանել + գործել)

Որտեղ՝

Մուտքային տվյալները օգտատիրոջ հարցում կամ իրադարձություն են (նոր էլ.փոստ, աջակցության տոմս, սենսորի ping):
Մտածելը լեզվական մոդել է, որը դատողություններ է անում հաջորդ քայլի մասին։
Act-ը գործիքի կանչ է (ներքին փաստաթղթերի որոնում, կոդի գործարկում, տոմսի ստեղծում, պատասխանի նախագիծ): OpenAI ֆունկցիայի կանչման ուղեցույց
Observe-ը գործիքի արդյունքի ընթերցումն է։
Կրկնությունն այն մասն է, որը «գործակալական» զգացողություն է հաղորդում՝ «խոսակցականի» փոխարեն։ LangChain-ի «Գործակալներ» փաստաթղթերը

Որոշ գործակալներ հիմնականում խելացի մակրոներ են։ Մյուսները գործում են ավելի շատ որպես կրտսեր օպերատորներ, որոնք կարող են ժոնգլիավորել առաջադրանքները և վերականգնվել սխալներից։ Երկուսն էլ հաշվի են առնվում։.

Բացի այդ, ձեզ լիարժեք ինքնավարություն պետք չէ։ Իրականում… դուք հավանաբար դա չեք ուզում 🙃

2) Ե՞րբ պետք է գործակալ ստեղծել (և երբ՝ ոչ) 🚦

Ստեղծեք գործակալ, երբ՝

Աշխատանքը բազմափուլ և փոխվում է՝ կախված կեսից կատարվածից։
Աշխատանքը պահանջում է գործիքների օգտագործում (տվյալների բազաներ, CRM համակարգեր, կոդի կատարում, ֆայլերի ստեղծում, զննարկիչներ, ներքին API-ներ): LangChain «Գործիքներ» փաստաթղթեր
Դուք ցանկանում եք կրկնվող արդյունքներ պաշտպանիչ ցանկապատերի միջոցով, այլ ոչ թե միայն միանգամյա լուծումներ։
Դուք կարող եք «պատրաստ» բառը սահմանել այնպես, որ համակարգիչը կարողանա ստուգել, նույնիսկ ազատորեն։.

Մի՛ ստեղծեք գործակալ, երբ՝

Պարզ հուշում + պատասխանը լուծում է խնդիրը (չափազանց մի՛ մտածեք, հետո ինքներդ ձեզ ատելու եք):.
Ձեզ անհրաժեշտ է կատարյալ դետերմինիզմ (գործակալները կարող են լինել հետևողական, բայց ոչ ռոբոտային):.
Դուք չունեք որևէ գործիք կամ տվյալ կապվելու համար, այդ դեպքում դա հիմնականում պարզապես թրթռումներ են։.

Անկեղծ լինենք. «AI գործակալների նախագծերի» կեսը կարող է լինել աշխատանքային հոսք՝ մի քանի ճյուղավորման կանոններով։ Բայց երբեմն տրամադրությունը նույնպես կարևոր է 🤷♂️

3) Ի՞նչն է արհեստական բանականության գործակալի լավ տարբերակը դարձնում ✅

Ահա «Ինչն է դարձնում -ի լավ տարբերակը» բաժինը, որը դուք խնդրել եք, բացառությամբ այն բանի, որ ես մի փոքր կտրուկ եմ լինելու

Արհեստական բանականության գործակալի լավ տարբերակը չէ , ով ամենադժվարն է մտածում։ Այն նա է, ով.

Գիտի, թե ինչ է իրեն թույլատրվում անել (շրջանակի սահմաններ)
Հուսալիորեն օգտագործում է գործիքներ (կառուցվածքային զանգեր, կրկնվող փորձեր, ժամանակի ավարտներ) OpenAI ֆունկցիայի կանչման ուղեցույց AWS «Ժամկետի ավարտներ, կրկնվող փորձեր և հետընթաց՝ թրթռման դեպքում»
Պահպանում է վիճակը մաքուր (հիշողություն, որը չի փտում) LangChain «Հիշողության ակնարկ»
Բացատրում է իր գործողությունները (աուդիտի հետքեր, այլ ոչ թե գաղտնի դատողությունների տվյալների բազաներ) NIST AI RMF 1.0 (հուսալիություն և թափանցիկություն)
Համապատասխան կանգառներ (ավարտման ստուգումներ, առավելագույն քայլեր, էսկալացիա) LangChain «Գործակալների» փաստաթղթեր
Անվտանգորեն ձախողվում է (օգնություն է խնդրում, հեղինակություն չի առաջացնում) NIST AI RMF 1.0
Փորձարկելի է (կարող եք այն գործարկել պահածոյացված սցենարների վրա և գնահատել արդյունքները)

Եթե ձեր գործակալը չի կարող փորձարկվել, դա, ըստ էության, շատ վստահ խաղային ավտոմատ է։ Զվարճալի է երեկույթների ժամանակ, սարսափելի՝ արտադրության մեջ 😬

4) Գործակալի հիմնական կառուցվածքային բլոկները («անատոմիա» 🧩)

Պինդ գործակալների մեծ մասն ունի հետևյալ մասերը

Ա) Կառավարիչի ցիկլը 🔁

Սա է նվագախմբի ղեկավարը

խփել գոլը
հարցրեք մոդելին հաջորդ գործողության մասին
գործարկել գործիքը
կցել դիտարկում
կրկնել մինչև LangChain-ի «Գործակալների» փաստաթղթերի

Բ) Գործիքներ (այսինքն՝ հնարավորություններ) 🧰

Գործիքներն են, որոնք գործակալին արդյունավետ են դարձնում. LangChain-ի «Գործիքներ» փաստաթղթերը

տվյալների բազայի հարցումներ
էլեկտրոնային նամակներ ուղարկելը
ֆայլեր քաշելը
գործարկվող կոդ
ներքին API-ների կանչ
աղյուսակներում կամ CRM համակարգերում գրելը

Գ) Հիշողություն 🗃️

Երկու տեսակ կարևոր են

Կարճատև հիշողություն՝ ընթացիկ գործողությունների համատեքստ, վերջին քայլեր, ընթացիկ պլան
Երկարատև հիշողություն. օգտատիրոջ նախընտրություններ, նախագծի համատեքստ, ստացված գիտելիքներ (հաճախ ներդրված ֆայլերի + վեկտորային պահեստի միջոցով) RAG թուղթ

Դ) Պլանավորման և որոշումների կայացման քաղաքականություն 🧭

Նույնիսկ եթե դուք դա չեք անվանում «պլանավորում», ձեզ մեթոդ է անհրաժեշտ

ստուգաթերթիկներ
ReAct ոճի «մտածիր, ապա գործիք դարձրու» ReAct թուղթ
առաջադրանքի գրաֆիկներ
ղեկավար-աշխատող օրինաչափություններ
ղեկավար-աշխատող կաղապարներ Microsoft AutoGen (բազմաագենտային շրջանակ)

Ե) Պաշտպանիչ ցանկապատեր և գնահատում 🧯

թույլտվություններ
Անվտանգ գործիքային սխեմաներ OpenAI կառուցվածքային ելքեր
արդյունքի վավերացում
քայլերի սահմանափակումներ
անտառահատում
NIST AI RMF 1.0- ի թեստավորում

Այո, սա ավելի շատ ինժեներական աշխատանք է, քան հուշում։ Որն էլ… մոտավորապես իմաստն է։.

5) Համեմատական աղյուսակ. գործակալ կառուցելու հայտնի եղանակներ 🧾

Ստորև ներկայացված է իրատեսական «Համեմատական աղյուսակ»՝ մի քանի առանձնահատկություններով, քանի որ իրական թիմերը յուրահատուկ են 😄

Գործիք / Շրջանակ	Լսարան	Գինը	Ինչու է այն աշխատում	Նշումներ (փոքրիկ քաոս)
ԼանգՉեյն	շինարարներ, ովքեր սիրում են լեգո ոճի բաղադրիչներ	անվճար + ենթակառուցվածք	գործիքների, հիշողության, շղթաների մեծ էկոհամակարգ	կարող ես արագ սպագետի ստանալ, եթե իրերը հստակ չանվանես
Լամաների ինդեքս	RAG-ով ծանր թիմեր	անվճար + ենթակառուցվածք	ուժեղ որոնման օրինաչափություններ, ինդեքսավորում, միակցիչներ	հիանալի է, երբ ձեր գործակալը հիմնականում «փնտրում + գործողություն» է անում… ինչը տարածված է
OpenAI օգնականների ոճի մոտեցում	թիմեր, որոնք ցանկանում են ավելի արագ կազմակերպվել	օգտագործման վրա հիմնված	ներկառուցված գործիքի կանչման ձևանմուշներ և գործարկման վիճակ	որոշ անկյուններում պակաս ճկուն է, բայց մաքուր է շատ հավելվածների համար	OpenAI-ը գործարկում է API-ը , OpenAI օգնականների ֆունկցիայի կանչը
Սեմանտիկ միջուկ	մշակողներ, ովքեր ցանկանում են կառուցվածքային նվագախմբավորում	ազատ	հմտությունների/գործառույթների համար կոկիկ աբստրակցիա	զգացվում է «ձեռնարկության կոկիկ»՝ երբեմն դա հաճոյախոսություն է 😉
Ավտոգեներացիա	բազմա-գործակալային փորձարարներ	ազատ	գործակալից գործակալ համագործակցության մոդելներ	կարող է չափազանց շատ խոսել, սահմանել խիստ ազատման կանոններ
CrewAI	«գործակալների թիմերի» երկրպագուներ	ազատ	դերերը + առաջադրանքները + փոխանցումները հեշտ են արտահայտելու համար	լավագույնս աշխատում է, երբ առաջադրանքները հստակ են, ոչ թե փափուկ
Խոտի կույտ	որոնում + խողովակաշարեր մարդիկ	ազատ	պինդ խողովակաշարեր, արտահոսք, բաղադրիչներ	ավելի քիչ «գործակալական թատրոն», ավելի շատ «գործնական գործարան»
Ստեղծեք ձեր սեփականը (անհատական ցիկլ)	վերահսկողության մոլեռանդներ (սիրահարված)	քո ժամանակը	նվազագույն կախարդանք, առավելագույն պարզություն	սովորաբար լավագույն երկարաժամկետը… մինչև ամեն ինչ նորից հորինես 😅

Միակ հաղթող չկա։ Լավագույն ընտրությունը կախված է նրանից, թե ձեր գործակալի հիմնական աշխատանքը տվյալների որոնումն, գործիքների կիրառումը, բազմագործակալային համակարգումը, թե՞ աշխատանքային հոսքի ավտոմատացումը։

6) Ինչպես քայլ առ քայլ ստեղծել արհեստական բանականության գործակալ (իրական բաղադրատոմսը) 🍳🤖

Սա այն մասն է, որը մարդկանց մեծ մասը բաց է թողնում, ապա զարմանում, թե ինչու է գործակալը իրեն պահում ինչպես ջրարջը պահեստում։.

Քայլ 1. Մեկ նախադասությամբ սահմանեք աշխատանքը 🎯

Օրինակներ՝

«Կազմեք հաճախորդի պատասխան՝ օգտագործելով քաղաքականությունը և տոմսի համատեքստը, այնուհետև խնդրեք հաստատում»։
«Ուսումնասիրեք սխալի մասին հաղորդագրությունը, վերարտադրեք այն և առաջարկեք լուծում»։
«Անավարտ հանդիպումների նշումները վերածեք առաջադրանքների, պատասխանատուների և վերջնաժամկետների»։

Եթե դուք չեք կարող այն պարզ սահմանել, ձեր գործակալը նույնպես չի կարող։ Այսինքն՝ կարող է, բայց այն կիմպրովիզացնի, իսկ իմպրովիզացիայի միջոցով են բյուջեները «մեռնում»։.

Քայլ 2. Որոշեք ինքնավարության մակարդակը (ցածր, միջին, սուր) 🌶️

Ցածր ինքնավարություն. առաջարկում է քայլեր, մարդկային սեղմումները «հաստատում» են
Միջին. գործարկում է գործիքները, նախագծում է արդյունքը, արագացնում է անորոշության դեպքում
Բարձր։ կատարում է ծայրից ծայր, մարդկանց ping է ուղարկում միայն բացառությունների դեպքում։

Սկսեք ավելի ցածր, քան ցանկանում եք։ Դուք միշտ կարող եք ավելի ուշ արագացնել այն։.

Քայլ 3. Ընտրեք ձեր մոդելային ռազմավարությունը 🧠

Դուք սովորաբար ընտրում եք

մեկ ուժեղ մոդել ամեն ինչի համար (պարզ)
մեկ ուժեղ մոդել + ավելի փոքր մոդել՝ էժան աստիճանների համար (դասակարգում, երթուղավորում)
անհրաժեշտության դեպքում մասնագիտացված մոդելներ (տեսողություն, կոդ, խոսք)

Որոշեք նաև

առավելագույն թոքեններ
ջերմաստիճան
արդյոք թույլ եք տալիս ներքին երկար դատողությունների հետքեր (կարող եք, բայց մի՛ բացահայտեք մտքի հում շղթան վերջնական օգտագործողներին):

Քայլ 4. Սահմանեք գործիքները խիստ սխեմաներով 🔩

Գործիքները պետք է լինեն

նեղ
տպագրված
թույլատրված
վավերացված OpenAI կառուցվածքային արդյունքներ

do_anything(input: string) անունով գործիքի փոխարեն , կատարեք՝

search_kb(հարցում՝ տող) -> արդյունքներ[]
create_ticket(վերնագիր՝ տող, մարմին՝ տող, առաջնահերթություն՝ համարակալում) -> ticket_id
send_email(to: string, subject: string, body: string) -> status OpenAI ֆունկցիայի կանչման ուղեցույց

Եթե գործակալին շղթայական սղոց տաք, մի զարմացեք, երբ նա կկտրի ցանկապատը՝ հեռացնելով նաև ցանկապատը։.

Քայլ 5. Կառուցեք կառավարիչի ցիկլը 🔁

Նվազագույն ցիկլ՝

Սկսեք նպատակից + նախնական համատեքստից
Հարցրեք մոդելին. «Հաջորդ գործողությունը՞»
Եթե գործիքի կանչ - գործիքի կատարում
Կցել դիտարկումը
Ստուգեք կանգառի վիճակը
Կրկնել (առավելագույն քայլերով) LangChain-ի «Գործակալների» փաստաթղթերը

Ավելացնել՝

թայմ-աութներ
վերստին փորձեր (զգույշ եղեք՝ վերստին փորձերը կարող են կրկնվել) AWS «Ժամանակի ավարտ, վերստին փորձեր և նահանջ՝ թրթռումով»
գործիքի սխալի ձևաչափում (պարզ, կառուցվածքային)

Քայլ 6. Զգուշորեն ավելացրեք հիշողություն 🗃️

Կարճաժամկետ. պահպանել կոմպակտ «վիճակի ամփոփումը» թարմացված ամեն քայլափոխի։ LangChain «Հիշողության ակնարկ»
Երկարաժամկետ. պահպանել կայուն փաստեր (օգտատիրոջ նախընտրություններ, կազմակերպության կանոններ, կայուն փաստաթղթեր)։

Հիմնական կանոն

եթե այն հաճախ է փոխվում, թող այն կարճաժամկետ լինի
եթե կայուն է, պահպանեք երկար ժամանակ
եթե այն զգայուն է, պահեք նվազագույնի (կամ ընդհանրապես մի պահեք)

Քայլ 7. Ավելացրեք վավերացում և «քննադատական» անցաթուղթ 🧪

Էժան, գործնական մոդել

գործակալը արդյունք է ստեղծում
վավերացնողը ստուգում է կառուցվածքը և սահմանափակումները
Բացակայող քայլերի կամ քաղաքականության խախտումների համար լրացուցիչ քննադատական մոդելի վերանայումներ NIST AI RMF 1.0

Կատարյալ չէ, բայց որսում է ցնցող քանակությամբ անհեթեթություններ։.

Քայլ 8. Գրանցեք այն ամենը, ինչի համար կզղջաք չգրանցելու համար 📜

Գրանցամատյան:

գործիքի կանչեր + մուտքեր + ելքեր
կայացված որոշումներ
սխալներ
վերջնական արդյունքներ
տոկեններ և լատենտություն OpenTelemetry դիտարկելիության այբբենարան

Ապագա՝ դու շնորհակալ կլինես։ Ներկա՝ դու կմոռանաս։ Դա ուղղակի կյանք է 😵💫

7) Գործիքների կանչ, որը չի կոտրի ձեր հոգին 🧰😵

Գործիքների կանչն այն է, երբ «Ինչպես կառուցել արհեստական բանականության գործակալ» հոդվածը վերածվում է իրական ծրագրային ապահովման ինժեներիայի։.

Գործիքները դարձրեք հուսալի (հուսալի լինելը լավ է)

Հուսալի գործիքներն են՝

դետերմինիստական
նեղ շրջանակով
հեշտ է փորձարկել
անվտանգ է վերագործարկել Stripe-ի «Idempotent requests»-ը

Ավելացրեք պաշտպանիչ ցանկապատեր գործիքների շերտում, այլ ոչ թե միայն հուշումներ

Հուշումները քաղաքավարի առաջարկներ են։ Գործիքների վավերացումը փակ դուռ է։ OpenAI կառուցվածքային արդյունքներ

Անել՝

թույլատրելի ցուցակներ (որ գործիքները կարող են գործարկվել)
մուտքագրման վավերացում
Գնային սահմանափակումներ OpenAI Գնային սահմանափակումների ուղեցույց
թույլտվությունների ստուգումներ յուրաքանչյուր օգտատիրոջ/կազմակերպության համար
«Չոր աշխատանքի ռեժիմ»՝ ռիսկային գործողությունների համար

Մասնակի ձախողման նախագծում

Գործիքները խափանվում են։ Ցանցերը տատանվում են։ Հաստատման ժամկետը լրանում է։ Գործակալը պետք է

մեկնաբանել սխալները
վերփորձել՝ համապատասխան դեպքում հետընթացով Google Cloud վերփորձի ռազմավարություն (հետընթաց + տատանում)
ընտրեք այլընտրանքային գործիքներ
էսկալացնել, երբ խրված է

Աննկատելիորեն արդյունավետ հնարք. վերադարձնել կառուցվածքային սխալներ, ինչպիսիք են՝

տեսակը՝ auth_error
տեսակը՝ չի գտնվել
type: rate_limited
Այսպիսով, մոդելը կարող է ինտելեկտուալ արձագանքել՝ խուճապի մատնվելու փոխարեն։

8) Հիշողություն, որը օգնում է, այլ ոչ թե հետապնդում է ձեզ 👻🗂️

Հիշողությունը հզոր է, բայց այն կարող է նաև դառնալ աղբարկղ։.

Կարճաժամկետ հիշողություն. պահպանեք այն կոմպակտ

Օգտագործել՝

վերջին N քայլերը
ընթացիկ ամփոփում (թարմացվում է յուրաքանչյուր ցիկլի համար)
ընթացիկ պլան
ընթացիկ սահմանափակումներ (բյուջե, ժամանակ, քաղաքականություն)

Եթե ամեն ինչ համատեքստի մեջ դնենք, կստանանք՝

ավելի բարձր գին
ավելի դանդաղ լատենտություն
ավելի շատ շփոթություն (այո, նույնիսկ այդ դեպքում)

Երկարատև հիշողություն. վերականգնում «լցոնման» փոխարեն

«Երկարատև հիշողության» մեծ մասը ավելի շատ նման է հետևյալին

ներդրվածքներ
վեկտորների խանութ
վերականգնման լրացված սերնդի (RAG) RAG թուղթ

Գործակալը չի անգիր անում։ Այն աշխատանքի ընթացքում վերականգնում է ամենակարևոր հատվածները։ LlamaIndex «RAG-ի ներածություն»

Հիշողության գործնական կանոններ

Պահպանեք «նախընտրությունները» որպես բացահայտ փաստեր. «Օգտատերը սիրում է կետերով ամփոփագրերը և ատում է էմոջիները» (լոլ, այստեղ՝ ոչ 😄):
Պահպանեք «որոշումները» ժամանակային նշագրերով կամ տարբերակներով (հակառակ դեպքում հակասություններ կկուտակվեն)
Երբեք գաղտնիքներ չպահեք, եթե իսկապես անհրաժեշտ չէ

Եվ ահա իմ անկատար փոխաբերությունը. հիշողությունը սառնարանի նման է։ Եթե այն երբեք չմաքրես, ի վերջո քո սենդվիչը սոխի և զղջման համ կունենա։.

9) Պլանավորման ձևեր (պարզից մինչև գեղեցիկ) 🧭✨

Պլանավորումը պարզապես վերահսկվող քայքայում է։ Մի՛ դարձրեք այն միստիկ։.

Ա ձևանմուշ՝ ստուգաթերթիկի պլանավորող ✅

Մոդելը ցուցադրում է քայլերի ցանկ
Կատարում է քայլ առ քայլ
Թարմացնում է ստուգաթերթիկի կարգավիճակը

Հիանալի է ներդրման համար։ Պարզ է, ստուգելի։.

Բ օրինաչափություն. ReAct ցիկլ (պատճառաբանություն + գործողություն) 🧠→🧰

մոդելը որոշում է գործիքի հաջորդ կանչը
դիտարկում է արդյունքը
կրկնում է ReAct-ի աշխատանքը

Սա գործակալի դասական զգացողությունն է։.

Գ ձևանմուշ՝ վերահսկիչ-աշխատող 👥

ղեկավարը նպատակը բաժանում է առաջադրանքների
աշխատողները կատարում են մասնագիտացված առաջադրանքներ
վերահսկիչը միավորում է արդյունքները Microsoft AutoGen (բազմաագենտային շրջանակ)

Սա արժեքավոր է, երբ առաջադրանքները զուգահեռելի են, կամ երբ դուք ցանկանում եք տարբեր «դերեր», ինչպիսիք են՝

հետազոտող
կոդավորող
խմբագիր
Որակի ապահովման ստուգիչ

D ձևանմուշ. Պլանավորել, ապա իրականացնել վերապլանի միջոցով 🔄

ստեղծել պլան
կատարել
եթե գործիքի արդյունքները փոխեն իրականությունը, վերապլանավորեք

Սա կանխում է գործակալի համառորեն վատ ծրագրին հետևելը։ Մարդիկ նույնպես դա անում են, եթե միայն հոգնած չեն, այդ դեպքում նրանք նույնպես հետևում են վատ ծրագրերի։.

10) Անվտանգություն, հուսալիություն և աշխատանքից չազատվել 🔐😅

Եթե ձեր գործակալը կարող է գործողություններ ձեռնարկել, ապա ձեզ անհրաժեշտ է անվտանգության դիզայն։ «Լավ չէ ունենալ»։ Անհրաժեշտ է։ NIST AI RMF 1.0

Կոշտ սահմանափակումներ

առավելագույն քայլեր մեկ վազքի համար
գործիքի առավելագույն կանչերը մեկ րոպեում
առավելագույն ծախս մեկ սեանսի համար (թոքենների բյուջե)
սահմանափակված գործիքներ հաստատման հետևում

Տվյալների մշակում

Մուտքագրվելուց առաջ խմբագրել զգայուն մուտքագրումները
առանձին միջավայրեր (մշակող vs արտադրություն)
ամենաքիչ արտոնություններով գործիքի թույլտվություններ

Վարքային սահմանափակումներ

ստիպել գործակալին մեջբերել ներքին ապացույցների հատվածներ (ոչ թե արտաքին հղումներ, այլ միայն ներքին հղումներ)
անորոշության դրոշներ են պահանջվում, երբ վստահությունը ցածր է
պահանջել «տալ պարզաբանող հարց», եթե մուտքագրված տվյալները երկիմաստ են

Հուսալի գործակալը ամենավստահը չէ։ Այն նա է, ով գիտի, թե երբ է կռահում… և ասում է դա։.

11) Փորձարկում և գնահատում (այն մասը, որից բոլորը խուսափում են) 🧪📏

Դու չես կարող բարելավել այն, ինչը չես կարող չափել։ Այո, այդ տողը անհեթեթ է, բայց նյարդայնացնող կերպով ճշմարիտ։.

Ստեղծեք սցենարների հավաքածու

Ստեղծեք 30-100 թեստային դեպք։

երջանիկ ուղիներ
եզրային պատյաններ
«Գործիքների խափանման» դեպքեր
երկիմաստ հարցումներ
Հակառակորդական հուշումներ (արագ ներարկման փորձեր) OWASP Լավագույն 10-ը LLM հավելվածների համար OWASP LLM01 արագ ներարկում

Միավորների արդյունքներ

Օգտագործեք այնպիսի չափանիշներ, ինչպիսիք են՝

առաջադրանքի հաջողության մակարդակը
ավարտման ժամանակը
գործիքի սխալի վերականգնման մակարդակը
հալյուցինացիաների հաճախականություն (ապացույցներ չունեցող պնդումներ)
մարդկային հաստատման մակարդակ (եթե վերահսկվող ռեժիմում է)

Հուշումների և գործիքների ռեգրեսիոն թեստեր

Ցանկացած ժամանակ, երբ դուք փոխում եք՝

գործիքի սխեմա
համակարգի հրահանգներ
վերականգնման տրամաբանություն
Հիշողության ձևաչափ
։ Կրկին գործարկեք ծրագիրը։

Գործակալները զգայուն կենդանիներ են։ Ինչպես սենյակային բույսերը, բայց ավելի թանկ։.

12) Տեղակայման սխեմաներ, որոնք չեն սպառի ձեր բյուջեն 💸🔥

Սկսեք մեկ ծառայությունից

գործակալի վերահսկիչի API
գործիքային ծառայություններ դրա հետևում
OpenTelemetry դիտարկելիության ներածություն և գրանցում

Ավելացրեք ծախսերի վերահսկման միջոցները վաղաժամ

քեշավորում որոնման արդյունքները
զրույցի վիճակի սեղմում ամփոփագրերով
օգտագործելով ավելի փոքր մոդելներ երթուղայնացման և արդյունահանման համար
«խորը մտածողության ռեժիմը» սահմանափակելով ամենադժվար քայլերով

Ընդհանուր ճարտարապետական ընտրություն

անհաստատակ կառավարիչ + արտաքին վիճակի պահեստ (DB/redis)
գործիքի կանչերը հնարավորության դեպքում իդեմպոտենտային են։ Stripe «Իդեմպոտենտային հարցումներ»
երկար առաջադրանքների հերթում (որպեսզի վեբ հարցումը հավերժ բաց չպահեք)

Նաև՝ կառուցեք «սպանող անջատիչ»։ Այն ձեզ պետք չի գա, մինչև իսկապես, իսկապես կարիք չունենաք 😬

13) Եզրափակիչ նշումներ՝ «Ինչպես ստեղծել արհեստական բանականության գործակալ» թեմայով կարճ տարբերակը 🎁🤖

Եթե ուրիշ ոչինչ չեք հիշում, հիշեք սա

Ինչպես կառուցել արհեստական բանականության գործակալ, հիմնականում վերաբերում է մոդելի շուրջ անվտանգ օղակ կառուցելուն: LangChain «Գործակալներ» փաստաթղթեր
Սկսեք հստակ նպատակից, ցածր ինքնավարությունից և խիստ գործիքներից: OpenAI կառուցվածքային արդյունքներ
Հիշողություն ավելացնել վերականգնման միջոցով, այլ ոչ թե անվերջ համատեքստային լցոնման միջոցով։ RAG թուղթ
Պլանավորումը կարող է պարզ լինել՝ ստուգաթերթիկները և վերապլանումը շատ բան են օգնում։.
Գրանցման և թեստավորման գործընթացները գործակալների քաոսը վերածում են մի բանի, որը կարող եք առաքել: OpenTelemetry դիտարկելիության ուղեցույց
Պաշտպանիչ ցանկապատերը պետք է լինեն կոդում, այլ ոչ թե միայն հուշումներում: OWASP-ի լավագույն 10 իրավաբանության ծրագրերի ցանկը

Գործակալը կախարդանք չէ։ Այն համակարգ է, որը բավականաչափ հաճախ է լավ որոշումներ կայացնում արժեքավոր լինելու համար… և ընդունում է պարտությունը, նախքան այն վնաս կպատճառի։ Ինչ-որ առումով՝ հանգիստ հանգստացնող 😌

Եվ այո, եթե այն ճիշտ կառուցեք, դա նման է փոքրիկ թվային ինտերնի վարձելուն, ով երբեք չի քնում, երբեմն խուճապի է մատնվում և սիրում է թղթաբանությունը: Այսպիսով, ըստ էության, ինտերն է:.

Իրական աշխարհի օրինակ՝ աջակցության տեսակավորման արհեստական բանականության գործակալի կառուցում 🎫🤖

Սցենար

Պատկերացրեք մի փոքր SaaS թիմ, որը շաբաթական ստանում է 120-180 աջակցության հայտ։ Հայտերի մեծ մասը բարդ չեն, բայց դրանք դեռևս ժամանակ են պահանջում՝ գաղտնաբառի վերականգնում, վճարման հարցեր, սխալների մասին հաղորդագրություններ, գործառույթների հարցումներ և «սա սպասելի՞ վարքագիծ է» հաղորդագրություններ։.

Պարզ չաթբոտը կարող է պատասխաններ գրել, բայց այն չի կարող հուսալիորեն ստուգել հաշվի կարգավիճակը, որոնել գիտելիքների բազայում, դասակարգել հրատապությունը կամ որոշել, թե երբ է մարդը պետք է միջամտի։ Ահա թե որտեղ է գործակալի դերը իմաստ ունենում։.

Նպատակը աջակցությունը լիովին փոխարինելը չէ։ Նպատակն է ստեղծել ցածր ինքնավարությամբ գործակալ, որը կարդում է նոր տոմսը, հավաքում համատեքստ, կազմում պատասխան և ուղղորդում այն ճիշտ հերթ։ Մարդը դեռևս հաստատում է հաճախորդի համար նախատեսված ցանկացած բան։.

Ինչ է պետք օգնականին

Անվտանգ աշխատելու համար գործակալին անհրաժեշտ է մուտքային տվյալների և գործիքների փոքր, կառավարվող հավաքածու

Մուտքային տոմսի տեքստը
Հաճախորդի պլանի տեսակը, հաշվի տարիքը և վերջին վճարման կարգավիճակը
Վերջին ապրանքային փոփոխությունների գրանցամատյան կամ հայտնի միջադեպեր
Ներքին օգնության կենտրոնի հոդվածներ
Տոմսերի թարմացման գործիք՝ սահմանափակ դաշտերով
Սևագրի պատասխանի գործիք, ոչ թե էլ.փոստ ուղարկելու գործիք
Հստակ սրման քաղաքականություն

Գործիքների ցանկը պետք է միտումնավոր սահմանափակ լինի

որոնման_օգնության_կենտրոն(հարցում)
ստանալ_հաճախորդի_կարգավիճակ(հաճախորդի_ID)
ստուգել_հայտնի_միջադեպերը(արտադրանքի_տարածք)
update_ticket_category(տոմսի_id, կատեգորիա, առաջնահերթություն)
նախագիծ_պատասխան(տոմսի_իդենտիֆիկատոր, պատասխանի_տեքստ)
escalate_to_human(տոմսի_id, պատճառ)

Ուշադրություն դարձրեք, թե ինչն է բացակայում. չկա «հաճախորդի գումարի վերադարձ», «հաշիվը փակել» կամ «վերջնական պատասխան ուղարկել» գործիք: Այդ գործողությունները չափազանց ռիսկային են առաջին տարբերակի համար:.

Օրինակային հրահանգ

Դուք SaaS արտադրանքի աջակցության տեսակավորման գործակալ եք։.

Ձեր աշխատանքն է դասակարգել մուտքային տոմսերը, հավաքել միայն անհրաժեշտ համատեքստը, մշակել առաջարկվող պատասխան և որոշել, թե արդյոք տոմսը պետք է վերանայվի։.

Կանոններ՝

Մի՛ ուղարկեք պատասխաններ անմիջապես հաճախորդներին։.

Արտադրանքի վերաբերյալ հարցերին պատասխանելուց առաջ օգտագործեք օգնության կենտրոնը։.

Ստուգեք հաճախորդի կարգավիճակը՝ նախքան հաշվարկի, պլանի կամ մուտքի վերաբերյալ հարցերին պատասխանելը։.

Եթե հաճախորդը նշում է իրավական սպառնալիքներ, տվյալների կորուստ, անվտանգության խնդիրներ, վճարման ձախողում, հաշվի չեղարկում կամ զայրացած լեզու, դիմեք մարդու։.

Եթե պատասխանը չի հաստատվում վերցված օգնության կենտրոնի բովանդակությամբ կամ հաշվի տվյալներով, նշեք, թե ինչն է բացակայում և քննարկեք խնդիրը։.

Կանգնեցրեք գործիքի առավելագույնը 6 կանչից հետո։.

Տոմսը «պատրաստ» է համարվում միայն այն դեպքում, երբ այն ունի կատեգորիա, առաջնահերթություն, ապացույցների ամփոփում, պատասխանի նախագիծ և կամ «անհրաժեշտ է մարդու հաստատում» կամ «բարձրացված է»։.

Ինչպես փորձարկել այն

Սկսեք 30 փորձնական տոմսերով, նախքան այն կենդանի օգտատերերին միացնելը։

10 սովորական տոմսեր, ինչպիսիք են գաղտնաբառի վերականգնումը, պլանի սահմանափակումները և «ինչպե՞ս անել» հիմնական հարցերը
5 հաշվարկային տոմս
5 սխալի մասին հաղորդում
5 երկիմաստ տոմս՝ բացակայող տեղեկատվությամբ
5 ռիսկային տոմսեր, ինչպիսիք են անվտանգության հետ կապված մտահոգությունները, վերադարձի պահանջները և զայրացած բողոքները

Յուրաքանչյուր տոմսի համար միավորներ տվեք՝

Արդյո՞ք այն ճիշտ կատեգորիա է ընտրել։
Արդյո՞ք այն ճիշտ գործիքն օգտագործեց պատասխանելուց առաջ։
Արդյո՞ք դա խուսափեց չհիմնավորված պահանջներից:
Արդյո՞ք դա սրեց ռիսկային տոմսերի թիվը։
Նախագիծը կարո՞ղ էր լուրջ խմբագրում կատարել։

Սկզբում բավարար է պարզ «անցած/չանցած» աղյուսակը։ Մի չափազանցեք գնահատման համակարգը, նախքան պարզեք, թե արդյոք գործակալը արժեք է տրամադրում, թե ոչ։.

Արդյունք

Օրինակելի արդյունք. Հիմնվելով այս աշխատանքային հոսքի օգտագործումից առաջ և հետո 30 նմուշային տոմսերի ժամանակագրման վրա, աջակցության պատասխանատուն կարող է չափել հետևյալը

Առաջին տեսակավորման միջին ժամանակը մեկ տոմսի համար 6 րոպեից կրճատվել է մինչև 90 վայրկյան
30 տոմս տեսակավորվել է 45 րոպեում՝ 3 ժամվա փոխարեն
30 տոմսերից 27-ը տեղադրված են ճիշտ կատեգորիայում
Ռիսկային տոմսերից 5-ը ճիշտ են ավելացվել
Հաճախորդի 0 պատասխան ուղարկվել է առանց մարդու հաստատման

Այս թվերը օրինակելի գնահատական են, այլ ոչ թե ապացուցված չափանիշ։ Չափումը հեշտ է կրկնել. ձեռքով չափեք թեստային տոմսերի նույն խմբաքանակի ժամանակը, այնուհետև գործարկեք դրանք գործակալի միջոցով և համեմատեք կատեգորիայի ճշգրտությունը, էսկալացիայի ճշգրտությունը և խմբագրման ժամանակը։.

Ի՞նչը կարող է սխալ ընթանալ

Գործակալը դեռ կարող է ձախողվել շատ սովորական ձևերով։.

Այն կարող է հիասթափված, բայց պարզ հաճախորդին դասակարգել որպես «շտապ», քանի որ լեզուն հնչում է զայրացած։ Այն կարող է վստահ պատասխան պատրաստել հնացած օգնության հոդվածից։ Այն կարող է շարունակել որոնումը, երբ ճիշտ քայլը սրելն է։ Այն կարող է չափազանց շատ հաշվի մանրամասներ բացահայտել պատասխանի նախագծում։.

Լուծումը «ավելի լավ հուշում գրելը» և հույսը չէ։ Ավելացրեք խիստ սահմանափակումներ։

Հայտնվելիս արագացնել հաշվարկային, անվտանգության, իրավական կամ չեղարկման լեզվով ծանուցումները
Պահանջել ներքին օգնության հոդվածներից մեջբերումներ ապացույցների ամփոփագրում
«Ուղարկել պատասխանը» պահեք մարդկային հաստատումից այն կողմ
Գրանցեք գործիքի յուրաքանչյուր զանգը և վերջնական նախագիծը
Վերագործարկեք 30-տոմսանոց թեստային հավաքածուն յուրաքանչյուր հուշումից, գործիքից կամ քաղաքականության փոփոխությունից հետո։

Գործնական ուսուցողական նյութ

Արժեքավոր գործակալը կարիք չունի դրամատիկ ինքնավարության: Այս օրինակում արժեքը գալիս է վերահսկվող ցիկլից. կարդացեք տոմսը, վերցրեք ճիշտ համատեքստը, դասակարգեք այն, կազմեք պատասխան և կանգ առեք վերանայման համար: Դա շատ ավելի հեշտ է վստահել, փորձարկել և կատարելագործել, քան այն գործակալին, որը փորձում է «կարգավորել աջակցությունը» մեկ հսկայական հուշումով:.

Հաճախակի տրվող հարցեր

Ի՞նչ է արհեստական բանականության գործակալը, պարզ լեզվով ասած։

Արհեստական բանականության գործակալը, ըստ էության, կրկնվող ցիկլ է. ընդունում է մուտքային տվյալներ, որոշում հաջորդ քայլը, օգտագործում է գործիք, կարդում է արդյունքը և կրկնում մինչև ավարտը: «Գործակալական» մասը գալիս է գործելուց և դիտարկելուց, այլ ոչ թե պարզապես զրուցելուց: Շատ գործակալներ պարզապես խելացի ավտոմատացում են՝ գործիքների հասանելիությամբ, մինչդեռ մյուսները ավելի շատ վարվում են որպես կրտսեր օպերատորներ, որոնք կարող են վերականգնվել սխալներից:.

Ե՞րբ պետք է արհեստական ինտելեկտի գործակալ ստեղծեմ՝ պարզապես հուշում օգտագործելու փոխարեն։

Ստեղծեք գործակալ, երբ աշխատանքը բազմափուլ է, փոփոխությունները հիմնված են միջանկյալ արդյունքների վրա և պահանջում է հուսալի գործիքների օգտագործում (API-ներ, տվյալների բազաներ, տոմսեր, կոդի կատարում): Գործակալները նաև օգտակար են, երբ ցանկանում եք կրկնվող արդյունքներ՝ պաշտպանիչ ցանկապատերով և «կատարվածը» ստուգելու միջոցով: Եթե պարզ արագ արձագանքը աշխատում է, գործակալը սովորաբար ավելորդ ծախսեր և լրացուցիչ ձախողման ռեժիմներ է առաջացնում:.

Ինչպե՞ս ստեղծել արհեստական ինտելեկտի գործակալ, որը չի խրվի ցիկլերի մեջ։

Օգտագործեք կոշտ կանգառի պայմաններ՝ առավելագույն քայլեր, գործիքի առավելագույն կանչեր և հստակ ավարտի ստուգումներ: Ավելացրեք կառուցվածքային գործիքային սխեմաներ, ժամանակի ավարտներ և վերստին փորձեր, որոնք հավերժ չեն վերստին փորձի: Գրանցեք որոշումները և գործիքի արդյունքները, որպեսզի կարողանաք տեսնել, թե որտեղ է այն խափանվում: Տարածված անվտանգության փական էսկալացիան. եթե գործակալը անորոշ է կամ կրկնում է սխալները, այն պետք է օգնություն խնդրի, այլ ոչ թե իմպրովիզացիա անի:.

Ո՞րն է արհեստական բանականության գործակալ կառուցելու նվազագույն ճարտարապետությունը։

Առնվազն ձեզ անհրաժեշտ է կառավարիչ ցիկլ, որը մոդելին կտրամադրի նպատակ և համատեքստ, կխնդրի հաջորդ գործողությունը, կկատարի գործիք, եթե պահանջվի, կկցի դիտարկումը և կկրկնի գործողությունը: Ձեզ նաև անհրաժեշտ են գործիքներ՝ խիստ մուտքային/ելքային ձևերով և «կատարված» ստուգմամբ: Նույնիսկ ինքնուրույն կատարվող ցիկլը կարող է լավ աշխատել, եթե պահպանեք մաքուր վիճակ և կիրառեք քայլերի սահմանափակումներ:.

Ինչպե՞ս պետք է նախագծեմ գործիքների կանչը, որպեսզի այն հուսալի լինի արտադրության մեջ։

Պահեք գործիքները նեղ, մուտքագրված, թույլտվություններով և վավերացված՝ խուսափեք ընդհանուր «անել_ինչ» գործիքից: Նախապատվությունը տվեք խիստ սխեմաներին (օրինակ՝ կառուցվածքային ելքեր/ֆունկցիաների կանչ), որպեսզի գործակալը չկարողանա ձեռքով փոխել մուտքային տվյալները: Ավելացրեք թույլատրելի ցուցակներ, արագության սահմանափակումներ և օգտատիրոջ/կազմակերպության թույլտվությունների ստուգումներ գործիքային մակարդակում: Նախագծեք գործիքները այնպես, որ հնարավորության դեպքում անվտանգ լինեն վերագործարկման համար՝ օգտագործելով նույնականության մոդելներ:.

Ո՞րն է հիշողություն ավելացնելու լավագույն միջոցը՝ առանց գործակալի վիճակը վատթարացնելու։

Հիշողությունը դիտարկեք երկու մասի՝ կարճաժամկետ աշխատանքային վիճակ (վերջին քայլերը, ընթացիկ պլանը, սահմանափակումները) և երկարաժամկետ վերականգնում (նախընտրություններ, կայուն կանոններ, համապատասխան փաստաթղթեր): Պահպանեք կարճաժամկետ կոմպակտությունը՝ օգտագործելով աշխատանքային ամփոփումներ, այլ ոչ թե ամբողջական տրանսկրիպտներ: Երկարաժամկետ հիշողության համար վերականգնումը (ներդրումներ + վեկտորային պահեստավորում/RAG ձևանմուշներ) սովորաբար գերազանցում է ամեն ինչ համատեքստի մեջ «լցոնելուն» և մոդելը շփոթելուն:.

Ո՞ր պլանավորման ձևանմուշը պետք է օգտագործեմ՝ ստուգաթերթիկ, ReAct, թե՞ ղեկավար-աշխատող։

Ստուգաթերթիկի պլանավորողը հիանալի է, երբ առաջադրանքները կանխատեսելի են, և դուք ցանկանում եք ինչ-որ բան, որը հեշտ է ստուգել: ReAct ոճի ցիկլերը փայլում են, երբ գործիքի արդյունքները փոխում են ձեր հաջորդ անելիքը: Ղեկավար-աշխատող մոդելները (ինչպես AutoGen ոճի դերերի բաժանումը) օգնում են, երբ առաջադրանքները կարող են զուգահեռացվել կամ օգտվել առանձին դերերից (հետազոտող, ծրագրավորող, որակի ապահովման մասնագետ): Պլանավորեք, ապա կատարեք վերապլանավորմամբ գործնական միջին հիմք է համառ վատ պլաններից խուսափելու համար:.

Ինչպե՞ս կարող եմ գործակալին անվտանգ դարձնել, եթե այն կարող է իրական գործողություններ ձեռնարկել։

Օգտագործեք ամենաքիչ արտոնություններով թույլտվություններ և սահմանափակեք ռիսկային գործիքները հաստատման կամ «չոր աշխատանքի» ռեժիմներից այն կողմ։ Ավելացրեք բյուջեներ և սահմանաչափեր՝ առավելագույն քայլեր, առավելագույն ծախսեր և գործիքների րոպեական կանչի սահմանաչափեր։ Մուտքագրվելուց առաջ խմբագրեք զգայուն տվյալները և առանձնացրեք մշակող միջավայրերը արտադրական միջավայրերից։ Պահանջեք անորոշության դրոշներ կամ պարզաբանող հարցեր, երբ մուտքային տվյալները երկիմաստ են, փոխարենը թույլ տալու, որ վստահությունը փոխարինի ապացույցներին։.

Ինչպե՞ս փորձարկել և գնահատել արհեստական բանականության գործակալին, որպեսզի այն ժամանակի ընթացքում բարելավվի։

Կառուցեք սցենարների հավաքածու՝ հաջող ուղիներով, եզրային դեպքերով, գործիքների ձախողումներով, երկիմաստ հարցումներով և հուշումների ներարկման փորձերով (OWASP ոճով): Գնահատեք արդյունքները, ինչպիսիք են առաջադրանքի հաջողությունը, ավարտման ժամանակը, գործիքի սխալներից վերականգնումը և ապացույցներ չունեցող պնդումները: Ամեն անգամ, երբ փոխում եք գործիքի սխեմաները, հուշումները, վերականգնումը կամ հիշողության ձևաչափումը, վերագործարկեք հավաքածուն: Եթե չեք կարող այն փորձարկել, չեք կարող այն հուսալիորեն գործարկել:.

Ինչպե՞ս տեղակայեմ գործակալ՝ առանց լատենտության և ծախսերի ավելացման։

Տարածված օրինաչափությունը վիճակազուրկ կառավարիչն է՝ արտաքին վիճակների պահոցով (DB/Redis), գործիքային ծառայություններով և ուժեղ գրանցումով/մոնիթորինգով (հաճախ OpenTelemetry): Վերահսկեք ծախսերը՝ օգտագործելով տվյալների վերականգնման քեշավորում, վիճակների կոմպակտ ամփոփումներ, երթուղայնացման/արդյունահանման ավելի փոքր մոդելներ և «խորը մտածողությունը» սահմանափակելով ամենադժվար քայլերով: Օգտագործեք հերթեր երկար առաջադրանքների համար, որպեսզի վեբ հարցումները բաց չպահեք: Միշտ ներառեք «կասեցման» անջատիչ:.

Հղումներ

Ստանդարտների և տեխնոլոգիաների ազգային ինստիտուտ (NIST) - NIST AI RMF 1.0 (հուսալիություն և թափանցիկություն) - nvlpubs.nist.gov
OpenAI - Կառուցվածքային արդյունքներ - platform.openai.com
OpenAI - Ֆունկցիաների կանչման ուղեցույց - platform.openai.com
OpenAI - Գնագոյացման սահմանաչափերի ուղեցույց - platform.openai.com
OpenAI - Գործարկում է API - platform.openai.com
OpenAI - Օգնականների ֆունկցիաների կանչ - platform.openai.com
LangChain - Գործակալների փաստաթղթեր (JavaScript) - docs.langchain.com
LangChain - Գործիքների փաստաթղթեր (Python) - docs.langchain.com
LangChain - Հիշողության ակնարկ - docs.langchain.com
arXiv - ReAct թուղթ (պատճառաբանություն + գործողություն) - arxiv.org
arXiv - RAG հոդված - arxiv.org
Amazon Web Services (AWS) Builders' Library - Ժամանակի ավարտ, կրկնակի փորձեր և հետընթաց՝ թրթռման դեպքում - aws.amazon.com
OpenTelemetry - Դիտարկելիության ներածություն - opentelemetry.io
Stripe - Իդեմպոտենտ հարցումներ - docs.stripe.com
Google Cloud - Կրկնակի փորձի ռազմավարություն (հետընթաց + տատանում) - docs.cloud.google.com
OWASP - Մեծ լեզվական մոդելի կիրառությունների լավագույն 10-ը - owasp.org
OWASP - LLM01 Արագ ներարկում - genai.owasp.org
LlamaIndex - RAG-ի ներածություն - developers.llamaindex.ai
Microsoft - Semantic Kernel - learn.microsoft.com
Microsoft AutoGen - Բազմագենտ շրջանակ (փաստաթղթեր) - microsoft.github.io
CrewAI - Գործակալների հայեցակարգեր - docs.crewai.com
Խոտի կույտ (խորը կույտ) - Վերականգնվողների փաստաթղթեր - docs.haystack.deepset.ai

Գտեք արհեստական բանականության վերջին նորույթները պաշտոնական արհեստական բանականության օգնականների խանութում

Մեր մասին

Վերադառնալ բլոգ

Լրացուցիչ Հաճախակի տրվող հարցեր

Ինչպե՞ս կարող եմ ապահովել իմ արհեստական բանականության գործակալի նախագծի հաջողությունը։

Ձեր արհեստական բանականության գործակալի նախագծի հաջողությունն ապահովելու համար մեկ նախադասությամբ հստակ սահմանեք աշխատանքը և որոշեք ինքնավարության այն մակարդակը, որին դուք հարմարավետ եք զգում: Բացի այդ, կիրառեք գործիքային խիստ սխեմաներ, գրանցումների և վավերացման ռազմավարություններ՝ տարածված թերությունները կանխելու և խնդիրների ավելի լավ լուծում ապահովելու համար:.
Ի՞նչ պետք է հաշվի առնեմ իմ արհեստական բանականության գործակալի համար գործիքներ նախագծելիս։

Ձեր արհեստական բանականության գործակալի համար գործիքներ մշակելիս համոզվեք, որ դրանք նեղ ուշադրության կենտրոնում են, տպագրված են և ունեն թույլտվություններ: Խուսափեք ցանկացած գործողություն կատարելու համար նախատեսված ընդհանուր գործիքներից: Դրա փոխարեն ստեղծեք հատուկ ֆունկցիաների կանչեր, որոնք գործակալը կարող է օգտագործել անվտանգությունն ու հուսալիությունը պահպանելու համար:.
Ինչպե՞ս սահմանեմ իմ արհեստական ինտելեկտի գործակալի համար հստակ կանգնեցման պայմաններ։

Ձեր արհեստական ինտելեկտի գործակալի համար հստակ կանգառի պայմաններ սահմանելու համար սահմանեք քայլերի առավելագույն քանակը, որոնք նա կարող է ձեռնարկել, ինչպես նաև ժամկետանցները և ավարտի ստուգումները: Սա կօգնի կանխել գործակալի խրվելը ցիկլերի մեջ և ապահովել, որ անհրաժեշտության դեպքում նա կարողանա սրել խնդիրները:.
Ո՞րն է արհեստական բանականության գործակալի հիշողությունը կառավարելու լավագույն միջոցը։

Կառավարեք ձեր արհեստական բանականության գործակալի հիշողությունը՝ այն բաժանելով կարճաժամկետ և երկարաժամկետ բաղադրիչների: Պահպանեք կարճաժամկետ հիշողությունը կոմպակտ՝ կենտրոնանալով ընթացիկ քայլերի և ծրագրերի վրա, միաժամանակ օգտագործելով երկարաժամկետ հիշողությունը կայուն տեղեկատվության համար, ինչպիսիք են օգտատիրոջ նախասիրությունները և կազմակերպության կանոնները:.
Կա՞ն արհեստական բանականության գործակալի ներսում առաջադրանքների պլանավորման հատուկ օրինաչափություններ։

Այո, կարելի է օգտագործել պլանավորման տարբեր մոդելներ, ինչպիսիք են կանխատեսելի առաջադրանքների ստուգաթերթիկները, գործիքների արդյունքներին հարմարվողական արձագանքների համար նախատեսված ReAct ցիկլերը և բարդ նախագծերի համար դերերի բաժանումը հնարավոր դարձնող ղեկավար-աշխատող մոդելները: Ընտրեք պլանավորման մեթոդ՝ հիմնվելով ձեր գործակալի կոնկրետ պահանջների վրա:.
Ինչպե՞ս կարող եմ արդյունավետորեն գնահատել իմ արհեստական ինտելեկտի գործակալի աշխատանքը։

Ձեր արհեստական ինտելեկտի գործակալի աշխատանքը գնահատելու համար ստեղծեք սցենարների հավաքածու, որը ներառում է հաջող ուղիներ, եզրային դեպքեր և երկիմաստ հարցումներ: Գնահատեք արդյունքները՝ հիմնվելով այնպիսի չափանիշների վրա, ինչպիսիք են առաջադրանքի հաջողության մակարդակը, արձագանքման ժամանակը և սխալներից վերականգնումը՝ նրա հնարավորությունները անընդհատ բարելավելու համար:.

1) Ի՞նչ է արհեստական ​​բանականության գործակալը՝ սովորական մարդու տեսանկյունից 🧠