Ինչպես ստեղծել արհեստական ​​բանականության գործակալ

Ինչպես ստեղծել արհեստական ​​բանականության գործակալ

Կարճ պատասխան. Գործնականում աշխատող արհեստական ​​բանականության գործակալ կառուցելու համար այն դիտարկեք որպես կառավարվող ցիկլ. ընդունեք մուտքային տվյալները, որոշեք հաջորդ գործողությունը, կանչեք նեղ շրջանակով գործիք, դիտարկեք արդյունքը և կրկնեք մինչև «կատարված» հստակ ստուգումը հաջողվի: Այն արժանի է իր նպատակին, երբ խնդիրը բազմաքայլ է և գործիքակազմված. եթե մեկ հուշում է լուծում այն, բաց թողեք գործակալը: Ավելացրեք գործիքների խիստ սխեմաներ, քայլերի սահմանափակումներ, գրանցում և վավերացուցիչ/քննադատ, որպեսզի երբ գործիքները ձախողվեն կամ մուտքային տվյալները երկիմաստ լինեն, գործակալը սկսի գործել ցիկլի փոխարեն:

Հիմնական եզրակացություններ՝

Կառավարիչի ցիկլ . Իրականացնել մուտքագրում → գործել → դիտարկել կրկնությունը՝ հստակ կանգառի պայմաններով և առավելագույն քայլերով։

Գործիքների դիզայն . գործիքները պահեք նեղ, տպագրված, թույլատրված և վավերացված՝ «անել ամեն ինչ» քաոսը կանխելու համար։

Հիշողության հիգիենա . օգտագործեք կոմպակտ կարճաժամկետ վիճակ գումարած երկարաժամկետ վերականգնում. խուսափեք ամբողջական տրանսկրիպտները թափելուց։

Չարաշահման դիմադրություն . ավելացրեք թույլատրելի ցուցակներ, արագության սահմանափակումներ, նույնականություն և «չոր գործարկում» ռիսկային գործողությունների համար։

Փորձարկելիություն . Պահպանել սցենարների հավաքածու (ձախողումներ, անորոշություն, ներարկումներ) և վերագործարկել յուրաքանչյուր փոփոխության դեպքում։

Ինչպե՞ս ստեղծել արհեստական ​​բանականության գործակալ։ Ինֆոգրաֆիկա
Հոդվածներ, որոնք կարող են ձեզ դուր գալ կարդալ սրանից հետո

🔗 Ինչպես չափել արհեստական ​​բանականության արդյունավետությունը
Սովորեք գործնական չափանիշներ՝ արագությունը, ճշգրտությունը և հուսալիությունը չափելու համար։.

🔗 Ինչպես խոսել արհեստական ​​բանականության հետ
Ավելի լավ պատասխաններ ստանալու համար օգտագործեք հուշումներ, համատեքստ և հետևություններ։.

🔗 Ինչպես գնահատել արհեստական ​​բանականության մոդելները
Համեմատեք մոդելները՝ օգտագործելով թեստեր, չափանիշներ և իրական աշխարհի առաջադրանքների արդյունքներ։.

🔗 Ինչպես օպտիմալացնել արհեստական ​​բանականության մոդելները
Բարելավեք որակը և արժեքը՝ կարգաբերելով, կտրելով և մոնիթորինգով։.


1) Ի՞նչ է արհեստական ​​բանականության գործակալը՝ սովորական մարդու տեսանկյունից 🧠

Արհեստական ​​բանականության գործակալը ցիկլ է։ LangChain-ի «Գործակալներ» փաստաթղթերը

Այսքանը։ Մի օղակ՝ մեջտեղում ուղեղով։.

Մուտքագրում → մտածել → գործել → դիտարկել → կրկնել ։ ReAct թուղթ (պատճառաբանել + գործել)

Որտեղ՝

  • Մուտքային տվյալները օգտատիրոջ հարցում կամ իրադարձություն են (նոր էլ.փոստ, աջակցության տոմս, սենսորի ping):

  • Մտածելը լեզվական մոդել է, որը դատողություններ է անում հաջորդ քայլի մասին։

  • Act-ը գործիքի կանչ է (ներքին փաստաթղթերի որոնում, կոդի գործարկում, տոմսի ստեղծում, պատասխանի նախագիծ): OpenAI ֆունկցիայի կանչման ուղեցույց

  • Observe-ը գործիքի արդյունքի ընթերցումն է։

  • Կրկնությունն այն մասն է, որը «գործակալական» զգացողություն է հաղորդում՝ «խոսակցականի» փոխարեն։ LangChain-ի «Գործակալներ» փաստաթղթերը

Որոշ գործակալներ հիմնականում խելացի մակրոներ են։ Մյուսները գործում են ավելի շատ որպես կրտսեր օպերատորներ, որոնք կարող են ժոնգլիավորել առաջադրանքները և վերականգնվել սխալներից։ Երկուսն էլ հաշվի են առնվում։.

Բացի այդ, ձեզ լիարժեք ինքնավարություն պետք չէ։ Իրականում… դուք հավանաբար դա չեք ուզում 🙃


2) Ե՞րբ պետք է գործակալ ստեղծել (և երբ՝ ոչ) 🚦

Ստեղծեք գործակալ, երբ՝

  • Աշխատանքը բազմափուլ և փոխվում է՝ կախված կեսից կատարվածից։

  • Աշխատանքը պահանջում է գործիքների օգտագործում (տվյալների բազաներ, CRM համակարգեր, կոդի կատարում, ֆայլերի ստեղծում, զննարկիչներ, ներքին API-ներ): LangChain «Գործիքներ» փաստաթղթեր

  • Դուք ցանկանում եք կրկնվող արդյունքներ պաշտպանիչ ցանկապատերի միջոցով, այլ ոչ թե միայն միանգամյա լուծումներ։

  • Դուք կարող եք «պատրաստ» բառը սահմանել այնպես, որ համակարգիչը կարողանա ստուգել, ​​նույնիսկ ազատորեն։.

Մի՛ ստեղծեք գործակալ, երբ՝

  • Պարզ հուշում + պատասխանը լուծում է խնդիրը (չափազանց մի՛ մտածեք, հետո ինքներդ ձեզ ատելու եք):.

  • Ձեզ անհրաժեշտ է կատարյալ դետերմինիզմ (գործակալները կարող են լինել հետևողական, բայց ոչ ռոբոտային):.

  • Դուք չունեք որևէ գործիք կամ տվյալ կապվելու համար, այդ դեպքում դա հիմնականում պարզապես թրթռումներ են։.

Անկեղծ լինենք. «AI գործակալների նախագծերի» կեսը կարող է լինել աշխատանքային հոսք՝ մի քանի ճյուղավորման կանոններով։ Բայց երբեմն տրամադրությունը նույնպես կարևոր է 🤷♂️


3) Ի՞նչն է արհեստական ​​բանականության գործակալի լավ տարբերակը դարձնում ✅

Ահա «Ինչն է դարձնում -ի լավ տարբերակը» բաժինը, որը դուք խնդրել եք, բացառությամբ այն բանի, որ ես մի փոքր կտրուկ եմ լինելու

Արհեստական ​​բանականության գործակալի լավ տարբերակը չէ , ով ամենադժվարն է մտածում։ Այն նա է, ով.

Եթե ​​ձեր գործակալը չի ​​կարող փորձարկվել, դա, ըստ էության, շատ վստահ խաղային ավտոմատ է։ Զվարճալի է երեկույթների ժամանակ, սարսափելի՝ արտադրության մեջ 😬


4) Գործակալի հիմնական կառուցվածքային բլոկները («անատոմիա» 🧩)

Պինդ գործակալների մեծ մասն ունի հետևյալ մասերը

Ա) Կառավարիչի ցիկլը 🔁

Սա է նվագախմբի ղեկավարը

Բ) Գործիքներ (այսինքն՝ հնարավորություններ) 🧰

Գործիքներն են, որոնք գործակալին արդյունավետ են դարձնում. LangChain-ի «Գործիքներ» փաստաթղթերը

  • տվյալների բազայի հարցումներ

  • էլեկտրոնային նամակներ ուղարկելը

  • ֆայլեր քաշելը

  • գործարկվող կոդ

  • ներքին API-ների կանչ

  • աղյուսակներում կամ CRM համակարգերում գրելը

Գ) Հիշողություն 🗃️

Երկու տեսակ կարևոր են

  • Կարճատև հիշողություն ՝ ընթացիկ գործողությունների համատեքստ, վերջին քայլեր, ընթացիկ պլան

  • Երկարատև հիշողություն . օգտատիրոջ նախընտրություններ, նախագծի համատեքստ, ստացված գիտելիքներ (հաճախ ներդրված ֆայլերի + վեկտորային պահեստի միջոցով) RAG թուղթ

Դ) Պլանավորման և որոշումների կայացման քաղաքականություն 🧭

Նույնիսկ եթե դուք դա չեք անվանում «պլանավորում», ձեզ մեթոդ է անհրաժեշտ

Ե) Պաշտպանիչ ցանկապատեր և գնահատում 🧯

Այո, սա ավելի շատ ինժեներական աշխատանք է, քան հուշում։ Որն էլ… մոտավորապես իմաստն է։.


5) Համեմատական ​​աղյուսակ. գործակալ կառուցելու հայտնի եղանակներ 🧾

Ստորև ներկայացված է իրատեսական «Համեմատական ​​աղյուսակ»՝ մի քանի առանձնահատկություններով, քանի որ իրական թիմերը յուրահատուկ են 😄

Գործիք / Շրջանակ Լսարան Գինը Ինչու է այն աշխատում Նշումներ (փոքրիկ քաոս)
ԼանգՉեյն շինարարներ, ովքեր սիրում են լեգո ոճի բաղադրիչներ անվճար + ենթակառուցվածք գործիքների, հիշողության, շղթաների մեծ էկոհամակարգ կարող ես արագ սպագետի ստանալ, եթե իրերը հստակ չանվանես
Լամաների ինդեքս RAG-ով ծանր թիմեր անվճար + ենթակառուցվածք ուժեղ որոնման օրինաչափություններ, ինդեքսավորում, միակցիչներ հիանալի է, երբ ձեր գործակալը հիմնականում «փնտրում + գործողություն» է անում… ինչը տարածված է
OpenAI օգնականների ոճի մոտեցում թիմեր, որոնք ցանկանում են ավելի արագ կազմակերպվել օգտագործման վրա հիմնված ներկառուցված գործիքի կանչման ձևանմուշներ և գործարկման վիճակ որոշ անկյուններում պակաս ճկուն է, բայց մաքուր է շատ հավելվածների համար OpenAI-ը գործարկում է API-ը , OpenAI օգնականների ֆունկցիայի կանչը
Սեմանտիկ միջուկ մշակողներ, ովքեր ցանկանում են կառուցվածքային նվագախմբավորում ազատ հմտությունների/գործառույթների համար կոկիկ աբստրակցիա զգացվում է «ձեռնարկության կոկիկ»՝ երբեմն դա հաճոյախոսություն է 😉
Ավտոգեներացիա բազմա-գործակալային փորձարարներ ազատ գործակալից գործակալ համագործակցության մոդելներ կարող է չափազանց շատ խոսել, սահմանել խիստ ազատման կանոններ
CrewAI «գործակալների թիմերի» երկրպագուներ ազատ դերերը + առաջադրանքները + փոխանցումները հեշտ են արտահայտելու համար լավագույնս աշխատում է, երբ առաջադրանքները հստակ են, ոչ թե փափուկ
Խոտի կույտ որոնում + խողովակաշարեր մարդիկ ազատ պինդ խողովակաշարեր, արտահոսք, բաղադրիչներ ավելի քիչ «գործակալական թատրոն», ավելի շատ «գործնական գործարան»
Ստեղծեք ձեր սեփականը (անհատական ​​ցիկլ) վերահսկողության մոլեռանդներ (սիրահարված) քո ժամանակը նվազագույն կախարդանք, առավելագույն պարզություն սովորաբար լավագույն երկարաժամկետը… մինչև ամեն ինչ նորից հորինես 😅

Միակ հաղթող չկա։ Լավագույն ընտրությունը կախված է նրանից, թե ձեր գործակալի հիմնական աշխատանքը տվյալների որոնումն , գործիքների կիրառումը , բազմագործակալային համակարգումը , թե՞ աշխատանքային հոսքի ավտոմատացումը ։


6) Ինչպես քայլ առ քայլ ստեղծել արհեստական ​​բանականության գործակալ (իրական բաղադրատոմսը) 🍳🤖

Սա այն մասն է, որը մարդկանց մեծ մասը բաց է թողնում, ապա զարմանում, թե ինչու է գործակալը իրեն պահում ինչպես ջրարջը պահեստում։.

Քայլ 1. Մեկ նախադասությամբ սահմանեք աշխատանքը 🎯

Օրինակներ՝

  • «Կազմեք հաճախորդի պատասխան՝ օգտագործելով քաղաքականությունը և տոմսի համատեքստը, այնուհետև խնդրեք հաստատում»։

  • «Ուսումնասիրեք սխալի մասին հաղորդագրությունը, վերարտադրեք այն և առաջարկեք լուծում»։

  • «Անավարտ հանդիպումների նշումները վերածեք առաջադրանքների, պատասխանատուների և վերջնաժամկետների»։

Եթե ​​դուք չեք կարող այն պարզ սահմանել, ձեր գործակալը նույնպես չի կարող։ Այսինքն՝ կարող է, բայց այն կիմպրովիզացնի, իսկ իմպրովիզացիայի միջոցով են բյուջեները «մեռնում»։.

Քայլ 2. Որոշեք ինքնավարության մակարդակը (ցածր, միջին, սուր) 🌶️

  • Ցածր ինքնավարություն . առաջարկում է քայլեր, մարդկային սեղմումները «հաստատում» են

  • Միջին . գործարկում է գործիքները, նախագծում է արդյունքը, արագացնում է անորոշության դեպքում

  • Բարձր ։ կատարում է ծայրից ծայր, մարդկանց ping է ուղարկում միայն բացառությունների դեպքում։

Սկսեք ավելի ցածր, քան ցանկանում եք։ Դուք միշտ կարող եք ավելի ուշ արագացնել այն։.

Քայլ 3. Ընտրեք ձեր մոդելային ռազմավարությունը 🧠

Դուք սովորաբար ընտրում եք

  • մեկ ուժեղ մոդել ամեն ինչի համար (պարզ)

  • մեկ ուժեղ մոդել + ավելի փոքր մոդել՝ էժան աստիճանների համար (դասակարգում, երթուղավորում)

  • անհրաժեշտության դեպքում մասնագիտացված մոդելներ (տեսողություն, կոդ, խոսք)

Որոշեք նաև

  • առավելագույն թոքեններ

  • ջերմաստիճան

  • արդյոք թույլ եք տալիս ներքին երկար դատողությունների հետքեր (կարող եք, բայց մի՛ բացահայտեք մտքի հում շղթան վերջնական օգտագործողներին):

Քայլ 4. Սահմանեք գործիքները խիստ սխեմաներով 🔩

Գործիքները պետք է լինեն

do_anything(input: string) անունով գործիքի փոխարեն , կատարեք՝

  • search_kb(հարցում՝ տող) -> արդյունքներ[]

  • create_ticket(վերնագիր՝ տող, մարմին՝ տող, առաջնահերթություն՝ համարակալում) -> ticket_id

  • send_email(to: string, subject: string, body: string) -> status OpenAI ֆունկցիայի կանչման ուղեցույց

Եթե ​​գործակալին շղթայական սղոց տաք, մի զարմացեք, երբ նա կկտրի ցանկապատը՝ հեռացնելով նաև ցանկապատը։.

Քայլ 5. Կառուցեք կառավարիչի ցիկլը 🔁

Նվազագույն ցիկլ՝

  1. Սկսեք նպատակից + նախնական համատեքստից

  2. Հարցրեք մոդելին. «Հաջորդ գործողությունը՞»

  3. Եթե ​​գործիքի կանչ - գործիքի կատարում

  4. Կցել դիտարկումը

  5. Ստուգեք կանգառի վիճակը

  6. Կրկնել (առավելագույն քայլերով) LangChain-ի «Գործակալների» փաստաթղթերը

Ավելացնել՝

Քայլ 6. Զգուշորեն ավելացրեք հիշողություն 🗃️

Կարճաժամկետ. պահպանել կոմպակտ «վիճակի ամփոփումը» թարմացված ամեն քայլափոխի։ LangChain «Հիշողության ակնարկ»
Երկարաժամկետ. պահպանել կայուն փաստեր (օգտատիրոջ նախընտրություններ, կազմակերպության կանոններ, կայուն փաստաթղթեր)։

Հիմնական կանոն

  • եթե այն հաճախ է փոխվում, թող այն կարճաժամկետ լինի

  • եթե կայուն է, պահպանեք երկար ժամանակ

  • եթե այն զգայուն է, պահեք նվազագույնի (կամ ընդհանրապես մի պահեք)

Քայլ 7. Ավելացրեք վավերացում և «քննադատական» անցաթուղթ 🧪

Էժան, գործնական մոդել

  • գործակալը արդյունք է ստեղծում

  • վավերացնողը ստուգում է կառուցվածքը և սահմանափակումները

  • Բացակայող քայլերի կամ քաղաքականության խախտումների համար լրացուցիչ քննադատական ​​մոդելի վերանայումներ NIST AI RMF 1.0

Կատարյալ չէ, բայց որսում է ցնցող քանակությամբ անհեթեթություններ։.

Քայլ 8. Գրանցեք այն ամենը, ինչի համար կզղջաք չգրանցելու համար 📜

Գրանցամատյան:

Ապագա՝ դու շնորհակալ կլինես։ Ներկա՝ դու կմոռանաս։ Դա ուղղակի կյանք է 😵💫


7) Գործիքների կանչ, որը չի կոտրի ձեր հոգին 🧰😵

Գործիքների կանչն այն է, երբ «Ինչպես կառուցել արհեստական ​​բանականության գործակալ» հոդվածը վերածվում է իրական ծրագրային ապահովման ինժեներիայի։.

Գործիքները դարձրեք հուսալի (հուսալի լինելը լավ է)

Հուսալի գործիքներն են՝

Ավելացրեք պաշտպանիչ ցանկապատեր գործիքների շերտում, այլ ոչ թե միայն հուշումներ

Հուշումները քաղաքավարի առաջարկներ են։ Գործիքների վավերացումը փակ դուռ է։ OpenAI կառուցվածքային արդյունքներ

Անել՝

  • թույլատրելի ցուցակներ (որ գործիքները կարող են գործարկվել)

  • մուտքագրման վավերացում

  • Գնային սահմանափակումներ OpenAI Գնային սահմանափակումների ուղեցույց

  • թույլտվությունների ստուգումներ յուրաքանչյուր օգտատիրոջ/կազմակերպության համար

  • «Չոր աշխատանքի ռեժիմ»՝ ռիսկային գործողությունների համար

Մասնակի ձախողման նախագծում

Գործիքները խափանվում են։ Ցանցերը տատանվում են։ Հաստատման ժամկետը լրանում է։ Գործակալը պետք է

Աննկատելիորեն արդյունավետ հնարք. վերադարձնել կառուցվածքային սխալներ, ինչպիսիք են՝

  • տեսակը՝ auth_error

  • տեսակը՝ չի գտնվել

  • type: rate_limited
    Այսպիսով, մոդելը կարող է ինտելեկտուալ արձագանքել՝ խուճապի մատնվելու փոխարեն։


8) Հիշողություն, որը օգնում է, այլ ոչ թե հետապնդում է ձեզ 👻🗂️

Հիշողությունը հզոր է, բայց այն կարող է նաև դառնալ աղբարկղ։.

Կարճաժամկետ հիշողություն. պահպանեք այն կոմպակտ

Օգտագործել՝

  • վերջին N քայլերը

  • ընթացիկ ամփոփում (թարմացվում է յուրաքանչյուր ցիկլի համար)

  • ընթացիկ պլան

  • ընթացիկ սահմանափակումներ (բյուջե, ժամանակ, քաղաքականություն)

Եթե ​​ամեն ինչ համատեքստի մեջ դնենք, կստանանք՝

  • ավելի բարձր գին

  • ավելի դանդաղ լատենտություն

  • ավելի շատ շփոթություն (այո, նույնիսկ այդ դեպքում)

Երկարատև հիշողություն. վերականգնում «լցոնման» փոխարեն

«Երկարատև հիշողության» մեծ մասը ավելի շատ նման է հետևյալին

  • ներդրվածքներ

  • վեկտորների խանութ

  • վերականգնման լրացված սերնդի (RAG) RAG թուղթ

Գործակալը չի ​​անգիր անում։ Այն աշխատանքի ընթացքում վերականգնում է ամենակարևոր հատվածները։ LlamaIndex «RAG-ի ներածություն»

Հիշողության գործնական կանոններ

  • Պահպանեք «նախընտրությունները» որպես բացահայտ փաստեր. «Օգտատերը սիրում է կետերով ամփոփագրերը և ատում է էմոջիները» (լոլ, այստեղ՝ ոչ 😄):

  • Պահպանեք «որոշումները» ժամանակային նշագրերով կամ տարբերակներով (հակառակ դեպքում հակասություններ կկուտակվեն)

  • Երբեք գաղտնիքներ չպահեք, եթե իսկապես անհրաժեշտ չէ

Եվ ահա իմ անկատար փոխաբերությունը. հիշողությունը սառնարանի նման է։ Եթե այն երբեք չմաքրես, ի վերջո քո սենդվիչը սոխի և զղջման համ կունենա։.


9) Պլանավորման ձևեր (պարզից մինչև գեղեցիկ) 🧭✨

Պլանավորումը պարզապես վերահսկվող քայքայում է։ Մի՛ դարձրեք այն միստիկ։.

Ա ձևանմուշ՝ ստուգաթերթիկի պլանավորող ✅

  • Մոդելը ցուցադրում է քայլերի ցանկ

  • Կատարում է քայլ առ քայլ

  • Թարմացնում է ստուգաթերթիկի կարգավիճակը

Հիանալի է ներդրման համար։ Պարզ է, ստուգելի։.

Բ օրինաչափություն. ReAct ցիկլ (պատճառաբանություն + գործողություն) 🧠→🧰

  • մոդելը որոշում է գործիքի հաջորդ կանչը

  • դիտարկում է արդյունքը

  • կրկնում է ReAct-ի աշխատանքը

Սա գործակալի դասական զգացողությունն է։.

Գ ձևանմուշ՝ վերահսկիչ-աշխատող 👥

Սա արժեքավոր է, երբ առաջադրանքները զուգահեռելի են, կամ երբ դուք ցանկանում եք տարբեր «դերեր», ինչպիսիք են՝

  • հետազոտող

  • կոդավորող

  • խմբագիր

  • Որակի ապահովման ստուգիչ

D ձևանմուշ. Պլանավորել, ապա իրականացնել վերապլանի միջոցով 🔄

  • ստեղծել պլան

  • կատարել

  • եթե գործիքի արդյունքները փոխեն իրականությունը, վերապլանավորեք

Սա կանխում է գործակալի համառորեն վատ ծրագրին հետևելը։ Մարդիկ նույնպես դա անում են, եթե միայն հոգնած չեն, այդ դեպքում նրանք նույնպես հետևում են վատ ծրագրերի։.


10) Անվտանգություն, հուսալիություն և աշխատանքից չազատվել 🔐😅

Եթե ​​ձեր գործակալը կարող է գործողություններ ձեռնարկել, ապա ձեզ անհրաժեշտ է անվտանգության դիզայն։ «Լավ չէ ունենալ»։ Անհրաժեշտ է։ NIST AI RMF 1.0

Կոշտ սահմանափակումներ

  • առավելագույն քայլեր մեկ վազքի համար

  • գործիքի առավելագույն կանչերը մեկ րոպեում

  • առավելագույն ծախս մեկ սեանսի համար (թոքենների բյուջե)

  • սահմանափակված գործիքներ հաստատման հետևում

Տվյալների մշակում

  • Մուտքագրվելուց առաջ խմբագրել զգայուն մուտքագրումները

  • առանձին միջավայրեր (մշակող vs արտադրություն)

  • ամենաքիչ արտոնություններով գործիքի թույլտվություններ

Վարքային սահմանափակումներ

  • ստիպել գործակալին մեջբերել ներքին ապացույցների հատվածներ (ոչ թե արտաքին հղումներ, այլ միայն ներքին հղումներ)

  • անորոշության դրոշներ են պահանջվում, երբ վստահությունը ցածր է

  • պահանջել «տալ պարզաբանող հարց», եթե մուտքագրված տվյալները երկիմաստ են

Հուսալի գործակալը ամենավստահը չէ։ Այն նա է, ով գիտի, թե երբ է կռահում… և ասում է դա։.


11) Փորձարկում և գնահատում (այն մասը, որից բոլորը խուսափում են) 🧪📏

Դու չես կարող բարելավել այն, ինչը չես կարող չափել։ Այո, այդ տողը անհեթեթ է, բայց նյարդայնացնող կերպով ճշմարիտ։.

Ստեղծեք սցենարների հավաքածու

Ստեղծեք 30-100 թեստային դեպք։

Միավորների արդյունքներ

Օգտագործեք այնպիսի չափանիշներ, ինչպիսիք են՝

  • առաջադրանքի հաջողության մակարդակը

  • ավարտման ժամանակը

  • գործիքի սխալի վերականգնման մակարդակը

  • հալյուցինացիաների հաճախականություն (ապացույցներ չունեցող պնդումներ)

  • մարդկային հաստատման մակարդակ (եթե վերահսկվող ռեժիմում է)

Հուշումների և գործիքների ռեգրեսիոն թեստեր

Ցանկացած ժամանակ, երբ դուք փոխում եք՝

  • գործիքի սխեմա

  • համակարգի հրահանգներ

  • վերականգնման տրամաբանություն

  • Հիշողության ձևաչափ
    ։ Կրկին գործարկեք ծրագիրը։

Գործակալները զգայուն կենդանիներ են։ Ինչպես սենյակային բույսերը, բայց ավելի թանկ։.


12) Տեղակայման սխեմաներ, որոնք չեն սպառի ձեր բյուջեն 💸🔥

Սկսեք մեկ ծառայությունից

Ավելացրեք ծախսերի վերահսկման միջոցները վաղաժամ

  • քեշավորում որոնման արդյունքները

  • զրույցի վիճակի սեղմում ամփոփագրերով

  • օգտագործելով ավելի փոքր մոդելներ երթուղայնացման և արդյունահանման համար

  • «խորը մտածողության ռեժիմը» ​​սահմանափակելով ամենադժվար քայլերով

Ընդհանուր ճարտարապետական ​​​​ընտրություն

  • անհաստատակ կառավարիչ + արտաքին վիճակի պահեստ (DB/redis)

  • գործիքի կանչերը հնարավորության դեպքում իդեմպոտենտային են։ Stripe «Իդեմպոտենտային հարցումներ»

  • երկար առաջադրանքների հերթում (որպեսզի վեբ հարցումը հավերժ բաց չպահեք)

Նաև՝ կառուցեք «սպանող անջատիչ»։ Այն ձեզ պետք չի գա, մինչև իսկապես, իսկապես կարիք չունենաք 😬


13) Եզրափակիչ նշումներ՝ «Ինչպես ստեղծել արհեստական ​​բանականության գործակալ» թեմայով կարճ տարբերակը 🎁🤖

Եթե ​​ուրիշ ոչինչ չեք հիշում, հիշեք սա

Գործակալը կախարդանք չէ։ Այն համակարգ է, որը բավականաչափ հաճախ է լավ որոշումներ կայացնում արժեքավոր լինելու համար… և ընդունում է պարտությունը, նախքան այն վնաս կպատճառի։ Ինչ-որ առումով՝ հանգիստ հանգստացնող 😌

Եվ այո, եթե այն ճիշտ կառուցեք, դա նման է փոքրիկ թվային ինտերնի վարձելուն, ով երբեք չի քնում, երբեմն խուճապի է մատնվում և սիրում է թղթաբանությունը: Այսպիսով, ըստ էության, ինտերն է:.


Հաճախակի տրվող հարցեր

Ի՞նչ է արհեստական ​​բանականության գործակալը, պարզ լեզվով ասած։

Արհեստական ​​բանականության գործակալը, ըստ էության, կրկնվող ցիկլ է. ընդունում է մուտքային տվյալներ, որոշում հաջորդ քայլը, օգտագործում է գործիք, կարդում է արդյունքը և կրկնում մինչև ավարտը: «Գործակալական» մասը գալիս է գործելուց և դիտարկելուց, այլ ոչ թե պարզապես զրուցելուց: Շատ գործակալներ պարզապես խելացի ավտոմատացում են՝ գործիքների հասանելիությամբ, մինչդեռ մյուսները ավելի շատ վարվում են որպես կրտսեր օպերատորներ, որոնք կարող են վերականգնվել սխալներից:.

Ե՞րբ պետք է արհեստական ​​ինտելեկտի գործակալ ստեղծեմ՝ պարզապես հուշում օգտագործելու փոխարեն։

Ստեղծեք գործակալ, երբ աշխատանքը բազմափուլ է, փոփոխությունները հիմնված են միջանկյալ արդյունքների վրա և պահանջում է հուսալի գործիքների օգտագործում (API-ներ, տվյալների բազաներ, տոմսեր, կոդի կատարում): Գործակալները նաև օգտակար են, երբ ցանկանում եք կրկնվող արդյունքներ՝ պաշտպանիչ ցանկապատերով և «կատարվածը» ստուգելու միջոցով: Եթե պարզ արագ արձագանքը աշխատում է, գործակալը սովորաբար ավելորդ ծախսեր և լրացուցիչ ձախողման ռեժիմներ է առաջացնում:.

Ինչպե՞ս ստեղծել արհեստական ​​ինտելեկտի գործակալ, որը չի խրվի ցիկլերի մեջ։

Օգտագործեք կոշտ կանգառի պայմաններ՝ առավելագույն քայլեր, գործիքի առավելագույն կանչեր և հստակ ավարտի ստուգումներ: Ավելացրեք կառուցվածքային գործիքային սխեմաներ, ժամանակի ավարտներ և վերստին փորձեր, որոնք հավերժ չեն վերստին փորձի: Գրանցեք որոշումները և գործիքի արդյունքները, որպեսզի կարողանաք տեսնել, թե որտեղ է այն խափանվում: Տարածված անվտանգության փական էսկալացիան. եթե գործակալը անորոշ է կամ կրկնում է սխալները, այն պետք է օգնություն խնդրի, այլ ոչ թե իմպրովիզացիա անի:.

Ո՞րն է արհեստական ​​բանականության գործակալ կառուցելու նվազագույն ճարտարապետությունը։

Առնվազն ձեզ անհրաժեշտ է կառավարիչ ցիկլ, որը մոդելին կտրամադրի նպատակ և համատեքստ, կխնդրի հաջորդ գործողությունը, կկատարի գործիք, եթե պահանջվի, կկցի դիտարկումը և կկրկնի գործողությունը: Ձեզ նաև անհրաժեշտ են գործիքներ՝ խիստ մուտքային/ելքային ձևերով և «կատարված» ստուգմամբ: Նույնիսկ ինքնուրույն կատարվող ցիկլը կարող է լավ աշխատել, եթե պահպանեք մաքուր վիճակ և կիրառեք քայլերի սահմանափակումներ:.

Ինչպե՞ս պետք է նախագծեմ գործիքների կանչը, որպեսզի այն հուսալի լինի արտադրության մեջ։

Պահեք գործիքները նեղ, մուտքագրված, թույլտվություններով և վավերացված՝ խուսափեք ընդհանուր «անել_ինչ» գործիքից: Նախապատվությունը տվեք խիստ սխեմաներին (օրինակ՝ կառուցվածքային ելքեր/ֆունկցիաների կանչ), որպեսզի գործակալը չկարողանա ձեռքով փոխել մուտքային տվյալները: Ավելացրեք թույլատրելի ցուցակներ, արագության սահմանափակումներ և օգտատիրոջ/կազմակերպության թույլտվությունների ստուգումներ գործիքային մակարդակում: Նախագծեք գործիքները այնպես, որ հնարավորության դեպքում անվտանգ լինեն վերագործարկման համար՝ օգտագործելով նույնականության մոդելներ:.

Ո՞րն է հիշողություն ավելացնելու լավագույն միջոցը՝ առանց գործակալի վիճակը վատթարացնելու։

Հիշողությունը դիտարկեք երկու մասի՝ կարճաժամկետ աշխատանքային վիճակ (վերջին քայլերը, ընթացիկ պլանը, սահմանափակումները) և երկարաժամկետ վերականգնում (նախընտրություններ, կայուն կանոններ, համապատասխան փաստաթղթեր): Պահպանեք կարճաժամկետ կոմպակտությունը՝ օգտագործելով աշխատանքային ամփոփումներ, այլ ոչ թե ամբողջական տրանսկրիպտներ: Երկարաժամկետ հիշողության համար վերականգնումը (ներդրումներ + վեկտորային պահեստավորում/RAG ձևանմուշներ) սովորաբար գերազանցում է ամեն ինչ համատեքստի մեջ «լցոնելուն» և մոդելը շփոթելուն:.

Ո՞ր պլանավորման ձևանմուշը պետք է օգտագործեմ՝ ստուգաթերթիկ, ReAct, թե՞ ղեկավար-աշխատող։

Ստուգաթերթիկի պլանավորողը հիանալի է, երբ առաջադրանքները կանխատեսելի են, և դուք ցանկանում եք ինչ-որ բան, որը հեշտ է ստուգել: ReAct ոճի ցիկլերը փայլում են, երբ գործիքի արդյունքները փոխում են ձեր հաջորդ անելիքը: Ղեկավար-աշխատող մոդելները (ինչպես AutoGen ոճի դերերի բաժանումը) օգնում են, երբ առաջադրանքները կարող են զուգահեռացվել կամ օգտվել առանձին դերերից (հետազոտող, ծրագրավորող, որակի ապահովման մասնագետ): Պլանավորեք, ապա կատարեք վերապլանավորմամբ գործնական միջին հիմք է համառ վատ պլաններից խուսափելու համար:.

Ինչպե՞ս կարող եմ գործակալին անվտանգ դարձնել, եթե այն կարող է իրական գործողություններ ձեռնարկել։

Օգտագործեք ամենաքիչ արտոնություններով թույլտվություններ և սահմանափակեք ռիսկային գործիքները հաստատման կամ «չոր աշխատանքի» ռեժիմներից այն կողմ։ Ավելացրեք բյուջեներ և սահմանաչափեր՝ առավելագույն քայլեր, առավելագույն ծախսեր և գործիքների րոպեական կանչի սահմանաչափեր։ Մուտքագրվելուց առաջ խմբագրեք զգայուն տվյալները և առանձնացրեք մշակող միջավայրերը արտադրական միջավայրերից։ Պահանջեք անորոշության դրոշներ կամ պարզաբանող հարցեր, երբ մուտքային տվյալները երկիմաստ են, փոխարենը թույլ տալու, որ վստահությունը փոխարինի ապացույցներին։.

Ինչպե՞ս փորձարկել և գնահատել արհեստական ​​բանականության գործակալին, որպեսզի այն ժամանակի ընթացքում բարելավվի։

Կառուցեք սցենարների հավաքածու՝ հաջող ուղիներով, եզրային դեպքերով, գործիքների ձախողումներով, երկիմաստ հարցումներով և հուշումների ներարկման փորձերով (OWASP ոճով): Գնահատեք արդյունքները, ինչպիսիք են առաջադրանքի հաջողությունը, ավարտման ժամանակը, գործիքի սխալներից վերականգնումը և ապացույցներ չունեցող պնդումները: Ամեն անգամ, երբ փոխում եք գործիքի սխեմաները, հուշումները, վերականգնումը կամ հիշողության ձևաչափումը, վերագործարկեք հավաքածուն: Եթե չեք կարող այն փորձարկել, չեք կարող այն հուսալիորեն գործարկել:.

Ինչպե՞ս տեղակայեմ գործակալ՝ առանց լատենտության և ծախսերի ավելացման։

Տարածված օրինաչափությունը վիճակազուրկ կառավարիչն է՝ արտաքին վիճակների պահոցով (DB/Redis), գործիքային ծառայություններով և ուժեղ գրանցումով/մոնիթորինգով (հաճախ OpenTelemetry): Վերահսկեք ծախսերը՝ օգտագործելով տվյալների վերականգնման քեշավորում, վիճակների կոմպակտ ամփոփումներ, երթուղայնացման/արդյունահանման ավելի փոքր մոդելներ և «խորը մտածողությունը» սահմանափակելով ամենադժվար քայլերով: Օգտագործեք հերթեր երկար առաջադրանքների համար, որպեսզի վեբ հարցումները բաց չպահեք: Միշտ ներառեք «կասեցման» անջատիչ:.

Հղումներ

  1. Ստանդարտների և տեխնոլոգիաների ազգային ինստիտուտ (NIST) - NIST AI RMF 1.0 (հուսալիություն և թափանցիկություն) - nvlpubs.nist.gov

  2. OpenAI - Կառուցվածքային արդյունքներ - platform.openai.com

  3. OpenAI - Ֆունկցիաների կանչման ուղեցույց - platform.openai.com

  4. OpenAI - Գնագոյացման սահմանաչափերի ուղեցույց - platform.openai.com

  5. OpenAI - Գործարկում է API - platform.openai.com

  6. OpenAI - Օգնականների ֆունկցիաների կանչ - platform.openai.com

  7. LangChain - Գործակալների փաստաթղթեր (JavaScript) - docs.langchain.com

  8. LangChain - Գործիքների փաստաթղթեր (Python) - docs.langchain.com

  9. LangChain - Հիշողության ակնարկ - docs.langchain.com

  10. arXiv - ReAct թուղթ (պատճառաբանություն + գործողություն) - arxiv.org

  11. arXiv - RAG հոդված - arxiv.org

  12. Amazon Web Services (AWS) Builders' Library - Ժամանակի ավարտ, կրկնակի փորձեր և հետընթաց՝ թրթռման դեպքում - aws.amazon.com

  13. OpenTelemetry - Դիտարկելիության ներածություն - opentelemetry.io

  14. Stripe - Իդեմպոտենտ հարցումներ - docs.stripe.com

  15. Google Cloud - Կրկնակի փորձի ռազմավարություն (հետընթաց + տատանում) - docs.cloud.google.com

  16. OWASP - Մեծ լեզվական մոդելի կիրառությունների լավագույն 10-ը - owasp.org

  17. OWASP - LLM01 Արագ ներարկում - genai.owasp.org

  18. LlamaIndex - RAG-ի ներածություն - developers.llamaindex.ai

  19. Microsoft - Semantic Kernel - learn.microsoft.com

  20. Microsoft AutoGen - Բազմագենտ շրջանակ (փաստաթղթեր) - microsoft.github.io

  21. CrewAI - Գործակալների հայեցակարգեր - docs.crewai.com

  22. Խոտի կույտ (խորը կույտ) - Վերականգնվողների փաստաթղթեր - docs.haystack.deepset.ai

Գտեք արհեստական ​​բանականության վերջին նորույթները պաշտոնական արհեստական ​​բանականության օգնականների խանութում

Մեր մասին

Վերադառնալ բլոգ