Արհեստական բանականությունն այլևս աղյուսակներում չի կպչում։ Այն ուրվագծում է, նկարում, կոլաժ է անում՝ երբեմն անհանգստորեն լավ։ Եթե երբևէ նստել և մտածել եք՝ լավ, բայց ինչպե՞ս իրականում ասեմ արհեստական բանականությանը, թե ինչ նկարի, ապա այստեղ է ի հայտ գալիս «արվեստի ոճեր արհեստական բանականության համար» գաղափարը։
Ստորև մենք կբացատրենք, թե որ ոճերն են ամենաշատը համապատասխանում տեքստից պատկեր փոխակերպման համակարգերին, ինչու են դրանք այդպես և ինչպես կարող եք դրանք կառավարել՝ առանց կորցնելու ձեր սեփական կայծը։ Ես կներառեմ մի քանի գործնական նշումներ գործնական փորձարկումներից (ներառյալ այն, թե ինչն է իրականում հաջողվել մի քանի փորձարկումներից հետո), ինչպես նաև որոշ տեխնիկական մանրամասներ, որպեսզի գործընթացը մի փոքր ավելի քիչ նման լինի զառ գլորելուն [1][2][3][4][5]:.
Հոդվածներ, որոնք կարող են ձեզ դուր գալ կարդալ սրանից հետո
🔗 Ինչպես ստեղծել արհեստական ինտելեկտի արվեստ. ամբողջական ուղեցույց սկսնակների համար
Քայլ առ քայլ ուղեցույց սկսնակների համար՝ արհեստական ինտելեկտի կողմից ստեղծված թվային արվեստի գործեր ստեղծելու համար։.
🔗 Արհեստական բանականության կողմից ստեղծված արվեստի արշալույսը. ստեղծագործականության ազատագրում, թե՞ հակասությունների հրահրում
Արհեստական բանականության կողմից ստեղծված արվեստի շուրջ ստեղծագործականության, էթիկայի և բանավեճերի ուսումնասիրություն։.
🔗 Գրաֆիկական դիզայնի լավագույն արհեստական ինտելեկտի գործիքները. Արհեստական ինտելեկտով աշխատող լավագույն դիզայնի ծրագրեր
Բացահայտեք հզոր արհեստական բանականության գործիքներ, որոնք վերափոխում են ժամանակակից գրաֆիկական դիզայնի աշխատանքային հոսքերը։.
Ի՞նչն է արհեստական բանականության համար նախատեսված գեղարվեստական ոճերը դարձնում իրականում լավը։ ✨
Մոդելների ընտրությունը պարզապես միտումների հետևից վազելը չէ։ Որոշ ոճերի մոդելների համար պարզապես ավելի հեշտ է հետևել դրանց։ Մի քանի պատճառ՝
-
Պարզություն - իսկապես տարբեր «կանոններով» ոճերը (կուբիզմի ճեղքված երկրաչափությունը, մանգայի գծերով ծանր վահանակները) ավելի կրկնվող են, քանի որ թիրախային տեսողականները այդքան շատ չեն շեղվում [3][4]:
-
Ճկունություն - խառնուրդներին հարմար ոճերը (օրինակ՝ «կիբերպանկ + ռեալիզմ») թույլ են տալիս ժամանակակից դիֆուզիոն մոդելներին հենվել խաչաձև ուշադրության վրա՝ իրերը մաքուր խառնելու համար [1]:
-
Ճանաչելիություն - ոճերը, որոնք մարզումների տվյալները հազար անգամ տեսել են (անիմե, իմպրեսիոնիզմ, ֆոտոռեալիզմ), ավելի ճշգրիտ են արտացոլվում [2]:
-
Տրամադրություն/Մթնոլորտ - «մելանխոլիկ», «հանգիստ» կամ «նեոնային լուսավորությամբ» բառերը հուսալիորեն փոխում են լուսավորությունը, գունապնակը և կոմպոզիցիան միտումնավոր զգացվող ձևերով [5]:
Նպատակը որևէ կլինիկական «ճշգրտություն» չէ: Այն ոճն է՝ որպես ձեր տրամադրության կամ պատմության կոնտեյներ, և մոդելին հուշելու սովորելը, որպեսզի այն կարողանա կրկին ու կրկին հայտնվել այդ կոնտեյներում:.
Ինչպես է արհեստական բանականությունը «տեսնում» ոճը (պարզ տարբերակ, առանց ժարգոնի գերբեռնվածության)
Ժամանակակից տեքստից պատկեր մոդելները համատեղում են երեք բան՝
-
Տեքստ-պատկեր համապատասխանեցում - CLIP-ի նման համակարգերը սովորում են, թե «որ բառերն են համապատասխանում որ տեսքին»։ Այսպիսով, երբ դուք ասում եք «կոպիտ թանաքի լվացում», այն այդ արտահայտությունը կապում է տեսողականի հետ [3]:
-
Դիֆուզիա թաքնված տարածությունում - Ներքևում, թաքնված դիֆուզիան աստիճանաբար սրում է աղմկոտ պատկերը ձեր նկարագրությանը համապատասխան: Ահա թե ինչպես է այն ձեռք բերում և՛ արդյունավետություն, և՛ վերահսկողություն [1]:
-
Արագ փոփոխիչներ - Փոքրիկ «համայնքային հնարքները»՝ կինեմատոգրաֆիկ լուսավորությունը, եզրային լուսավորությունը, բարձր կոնտրաստային ֆիլմի հատիկավորությունը, նման են կարգավորվող ցուցանակների, որոնք կարող եք դարսել միմյանց վրա [5]:
Ինչու է սա կարևոր. Եթե ոճը հստակորեն գոյություն ունի մարզման տվյալներում , և դուք այն նկարագրում եք ճիշտ հավելումներով, ապա արագ կստանաք կայուն արդյունքներ [1][2][5]:
Համեմատական աղյուսակ. Արհեստական բանականության համար հայտնի գեղարվեստական ոճեր 🖌️
Անկարգ, բայց օգտակար խաբուսիկ թերթիկ է գալիս
| Արվեստի ոճ | Լսարան | Գին (AI գործիքներ) | Ինչու է այն աշխատում |
|---|---|---|---|
| Ռեալիզմ | Լուսանկարիչներ, ապրանքանիշեր | Անվճար – $$$ | Հղկված և հուսալի տեսք ունի |
| Անիմե/Մանգա | Երիտասարդ երկրպագուներ, խաղացողներ | Անվճար - միջին գնով | Ուժեղ գծային կառուցվածք; անմիջապես ընթեռնելի |
| Սյուրռեալիզմ | Ստեղծագործողներ, երազողներ | Ազատի նման | Տարօրինակ խառնուրդները լավ են համապատասխանում դիֆուզիային |
| Կիբերպանկ | Տեխնոլոգիաների սիրահարներ, ֆուտուրիստներ | Հաճախ անվճար հավելումներ | Նեոն + կոնտրաստ = ակնթարթային «վա՜յ» գործոն ⚡ |
| Իմպրեսիոնիզմ | Արվեստի սիրահարներ | Միջին արժեք | Թեթև + վրձնագույն հյուսվածքները հարմար են մոդելների համար |
| Ցածր պոլի 3D | Դիզայներներ, մշակողներ | Բազմազան | Պարզ երկրաչափությունը պահպանում է արդյունքների հետևողականությունը |
| Պիքսելային արվեստ | Խաղացողներ, նոստալգիայի սիրահարներ | Անվճար (հիմնականում) | Կոշտ սահմանափակումների ուղեցույցի կազմը |
Դաշտային խզբզոց. կիբերպանկի դեպքում «մեղմ եզրային լույս + ծավալային մշուշ» առարկաները դարձնում է ավելի աչքի ընկնող։ Պիքսելային արվեստի դեպքում այն ամրացրեք «8-բիթ, 32×32, սահմանափակ պալիտրա» ՝ չափազանց մաքուր արդյունքներից խուսափելու համար։
Խորը վերլուծություն. Ռեալիզմ ընդդեմ սյուրռեալիզմի 🎭
Ռեալիզմը համամասնությունների և մանրամասների մասին է՝ կատարյալ է մարքեթինգային մրցույթների կամ արտադրանքի դիզայնի համար, որտեղ կարևոր է հավաստիությունը: Լուսանկարչական իրականությունը, մակերեսային ազատ տարածքը, ստուդիական լուսավորությունը, 85 մմ օբյեկտիվը արհեստական ինտելեկտին տալիս են հստակ տեխնիկական հենարաններ:
Մյուս կողմից, սյուրռեալիզմը երազային, անհնարին երկրաչափություն, Էշերի ոճով ։
Անիմե և Մանգա։ Արհեստական բանականության սիրելին 🌸
Անիմեն/մանգան գրեթե անարդարացիորեն արդյունավետ է։ Սահմանված գծայինը, բջիջների ստվերավորումը և պաշտամունքային համամասնությունները մոդելին տալիս են ֆիքսված ձևանմուշ, բացի այդ, դա ծիծաղելիորեն տարածված է մարզման տվյալներում [2]: Իսկ հիբրիդները՞: Ոսկի: Փորձեք կիբերպանկ անիմե սամուրայ կամ սթիմպանկ մանգա դետեկտիվ :
Հուշեք կառամատույցներ հենվելու համար
-
«Անիմեի հիմնական վիզուալ, դինամիկ դիրք, մաքուր գծային պատկեր, սելֆինգ, արտահայտիչ աչքեր, մանրամասն ֆոն»
-
«մանգա վահանակ, էկրանի երանգավորում, հոլանդական անկյուն, թանաքի շեշտադրում»
Նշում ինքներդ ձեզ համար. Եթե արտադրված պատկերները մշուշոտ են թվում, ավելացրեք «մաքուր գծային, հարթ ստվերաներկ» կամ սահմանափակեք գույները «սահմանափակ պալիտրա»-ով:
Կիբերպանկ և ֆուտուրիստական ոճեր ⚡
Նեոնային ցուցանակներ, քրոմապատ արտացոլանքներ, անձրևոտ գիշերներ՝ մոդելը կլանում է այս ամենը: Diffusion-ը հիանալի կերպով համատեղում է բարձր կոնտրաստային լուսավորությունը + անդրադարձնող նյութերը «նեոնային լուսավորությամբ նրբանցք, ծավալային մառախուղ, ջրափոսի արտացոլանքներ» նման հուշումները հաճախ պաստառի նման տեսք ունեն:
Հուշում ուղղելու համար. Մոմեմանման մակերեսներ՞: Հուշման մեջ «ենթամակերևութային ցրում, թաղանթային դասակարգում»
Իմպրեսիոնիզմ և գեղանկարչական հյուսվածքներ 🎨
Այստեղ մանրամասները թագավոր չեն։ Իմպրեսիոնիզմը ծաղկում է մեղմ եզրերի, կոտրված գույների և լույսի խաղի վրա։ Տեսանելի վրձնահարվածների, պլեներային լուսավորության, ոսկե ժամի նման հուշումները լավ են աշխատում։ Մոդելը մանրամասնություն է առաջարկում առանց չափազանց մեծ ռենդերինգի, ինչը, զվարճալի է, և՛ իսկական է, և՛ հաշվողականորեն հեշտ [4]:
Մինիմալիզմ, պիքսելային արվեստ և ռետրո 🕹️
Սահմանափակումները պարզեցնում են։ Ցածր պոլի-ն հիմնված է երկրաչափական պարզության վրա, իսկ պիքսելային արվեստը ամրագրված է լուծաչափով + պալիտրաով։
Օգտակար հուշումների շրջանակներ՝
-
«ցածր պոլի դիորամա, կոշտ եզրեր, հարթ ստվերում, շրջապատող օկլյուզիա»
-
«պիքսելային արտ, 32×32 սփրայթ, NES ոճ, սահմանափակ տատանում»
Կողմնակի նշում. Եթե պիքսելային արվեստը չափազանց սահուն է թվում, անալոգային ճշգրտության համար «CRT սկանավոր գծեր, խամրած ստվերներ»
Հիբրիդային միախառնումներ. Որտեղ է արհեստական բանականությունը փայլում ✨
Վայրի քարտ՝ խաչաձև փոշոտում: Diffusion-ը թույլ է տալիս միավորել այնպիսի ազդեցություններ, որոնց մեծ մասը չէր անդրադառնա՝ Վան Գոգի կիբերպանկ , անիմե նուար կուբիզմ , Վերածննդի մեքա-հրեշտակ: Սա նման է նեյրոնային ոճի փոխանցման 2.0-ին, բայց շատ ավելի կառավարելի է [1][4]:
Բաղադրատոմսի ձևաչափը՝
[Թեմա] + [Դարաշրջան/Շարժում] + [Լուսավորություն] + [Միջոց/Նյութ] + [Կոմպոզիցիա] + [Պալիտրա/Տրամադրություն]
Օրինակ՝ «ջութակահարը տանիքին - իմպրեսիոնիստական յուղաներկ - ոսկե ժամի լուսավորություն - կենտրոնից դուրս - նոստալգիկ պալիտրա»:
Հուշումային օրինաչափություններ, որոնք իրականում փոխում են արդյունքները 🛠️
Կրկնակի փորձնական վազքերից՝
-
Միջին + ոճի զուգակցումը պարզաբանում է եզրերը/տեքստուրաները՝ յուղային սյուրռեալիզմ, թվային մանգա [5]:
-
«Լուսավորությունն առաջինը» ռեալիզմն ավելի շատ է փոխում, քան բառերի կուտակումը։
-
Տեսախցիկի լեզուն (անկյունները, օբյեկտիվի երկարությունը) ապահովում է ակնթարթային կանխատեսելիություն։
-
Սահմանափակումները կարևոր են՝ մինիմալիզմի կամ պիքսելային արվեստի համար բացահայտորեն պարտադրում են լուծաչափը/պալիտրաը։
-
Փոքր խմբագրումներ > Մեծ վերաշարադրումներ ։ «Նեոն» → «նատրիում-գոլորշի» փոխարինումը հաճախ ավելի արդյունավետ է, քան լրիվ վերանորոգումը [5]:
Արագ իրականության ստուգում 🔍
-
Կողմնակալություն - Առցանց տարածված ոճերը (անիմե, ֆոտոռեալիզմ) գերակշռում են արդյունքներում. հազվագյուտները կարիք ունեն հղումների կամ ճշգրտման [2]:
-
Ինչու է Surreal-ը աշխատում - Diffusion-ի ազատությունը թաքցնում է անատոմիայի բացթողումները՝ տարօրինակ բաները դարձնելով միտումնավոր արված [1]:
-
Հրահանգի շեղում - Եթե բոլոր արդյունքները նույնն են թվում, թեման վերանայելուց առաջ փոփոխեք մոդիֆիկատորները [5]:
-
Իրավունքներ/Էթիկա - Տվյալների հավաքածուները լայնորեն մշակվում են. արդյունքները պետք է օգտագործվեն պատասխանատու կերպով, հատկապես առևտրային նպատակներով [2]:
Փոքրիկ նշումներ (իմ ավազարկղից) 🧪
-
Կիբերպանկ Դիմանկար - «դիմանկար, կապտականաչավուն-մանուշակագույն նեոն, անձրևոտ նրբանցք, եզրագծի լույս, 85 մմ, կինեմատոգրաֆիկ բոքե»:
Աշխատեց, քանի որ. օբյեկտիվը + լուսավորությունը ճշգրիտ տարանջատեցին օբյեկտիվը/ֆոնը։ -
Իմպրեսիոնիստական բնապատկեր - «գետափը ոսկե ժամին, իմպրեսիոնիստական յուղաներկ, տեսանելի վրձնի հարվածներ»:
Աշխատեց, քանի որ. միջին ամրացված հյուսվածք, լուսավորություն, որը մշակված է ջերմությամբ։ -
Pixel-Art Creature - «32×32 պիքսելային վիշապ, սահմանափակ տատանում, 1-px ուրվագիծ, իզոմետրիկ»
: Աշխատեց, քանի որ սահմանափակումները դադարեցին հարթեցնելը։
Արագ հղումներ (պատճենել/տեղադրել)
-
Ռեալիզմ (արտադրանք). «ստուդիական լուսանկար, փափուկ տուփի լուսավորություն, 50 մմ օբյեկտիվ, փայլուն կերամիկա, մաքուր սվաղ»
-
Անիմե գործողություն. «անիմեի հիմնական վիզուալ, կրճատված դինամիկ դիրք, բջջային ստվերաներկ, արագության գծեր»
-
Սյուրռեալիստական կոլաժ. «երազային տեսարան, անհնարին երկրաչափություն, լողացող աստիճաններ, մեղմ մառախուղ, ոսկե ժամի լույսի հատիկ»
-
Ցածր պոլի-տեսարան. «իզոմետրիկ ցածր պոլի-քաղաք, հարթ ստվերում, շրջակա միջավայրի օկլյուզիա, պաստելային պալիտրա»
-
Իմպրեսիոնիստական դիմանկար. «յուղաներկ կտավի վրա, ազատ վրձնագործություն, եզրային լույս, իմպաստոյի շեշտադրումներ»
Ամփոփում 🖼️
«Արհեստական ինտելեկտի համար արվեստի ոճերը» կանոնների գրքեր չեն, դրանք խաղահրապարակներ են։ Ռեալիզմը գործում է, երբ վստահությունը կարևոր է. սյուրռեալիզմը, երբ ուզում եք կոտրել իրականությունը. անիմե/մանգան, երբ ձեզ անհրաժեշտ է պարզություն՝ ոճերը խառնելու հնարավորությունով։ Հաղթական ռազմավարությունը կառուցվածքային խաղն է. ընտրեք ոճ, ընտրեք լուսավորություն + միջավայր, ավելացրեք մի քանի մոդիֆիկատորներ, ապա կրկնեք։ Եթե դա ձեզ ինչ-որ բան է զգացնում, նույնիսկ եթե այն տարօրինակ կերպով անկատար է, ապա դուք ճիշտ ուղղությամբ եք շարժվում։
Հղումներ
[1] Ռոմբախ, Ռ. և այլք (2022): Բարձր թույլտվությամբ պատկերի սինթեզ թաքնված դիֆուզիոն մոդելներով (CVPR): PDF
[2] Շուման, Ք. և այլք (2022): LAION-5B. Բաց լայնածավալ տվյալների հավաքածու՝ հաջորդ սերնդի պատկեր-տեքստ մոդելների մարզման համար: PDF
[3] Ռադֆորդ, Ա. և այլք (2021): Փոխանցելի տեսողական մոդելների ուսուցում բնական լեզվի վերահսկողությունից (CLIP): PDF
[4] Գատիս, Լ. և այլք (2016): Պատկերի ոճի փոխանցում՝ օգտագործելով կոնվոլյուցիոն նեյրոնային ցանցեր (CVPR): PDF
[5] Օպենլենդեր, Ջ. (2024): Տեքստը պատկերի վերածելու համար հուշումների մոդիֆիկատորների տաքսոնոմիա: Վարքագիծ և տեղեկատվական տեխնոլոգիաներ: Հոդված