Արվեստի ոճեր արհեստական ​​բանականության համար

Արհեստական ​​արվեստների ոճեր արհեստական ​​բանականության համար. ստեղծագործական հնարավորությունների ուսումնասիրություն

Արհեստական ​​բանականությունն այլևս աղյուսակներում չի կպչում։ Այն ուրվագծում է, նկարում, կոլաժ է անում՝ երբեմն անհանգստորեն լավ։ Եթե երբևէ նստել և մտածել եք՝ լավ, բայց ինչպե՞ս իրականում ասեմ արհեստական ​​բանականությանը, թե ինչ նկարի, ապա այստեղ է ի հայտ գալիս «արվեստի ոճեր արհեստական ​​բանականության համար» գաղափարը։

Ստորև մենք կբացատրենք, թե որ ոճերն են ամենաշատը համապատասխանում տեքստից պատկեր փոխակերպման համակարգերին, ինչու են դրանք այդպես և ինչպես կարող եք դրանք կառավարել՝ առանց կորցնելու ձեր սեփական կայծը։ Ես կներառեմ մի քանի գործնական նշումներ գործնական փորձարկումներից (ներառյալ այն, թե ինչն է իրականում հաջողվել մի քանի փորձարկումներից հետո), ինչպես նաև որոշ տեխնիկական մանրամասներ, որպեսզի գործընթացը մի փոքր ավելի քիչ նման լինի զառ գլորելուն [1][2][3][4][5]:.

Հոդվածներ, որոնք կարող են ձեզ դուր գալ կարդալ սրանից հետո

🔗 Ինչպես ստեղծել արհեստական ​​ինտելեկտի արվեստ. ամբողջական ուղեցույց սկսնակների համար
Քայլ առ քայլ ուղեցույց սկսնակների համար՝ արհեստական ​​ինտելեկտի կողմից ստեղծված թվային արվեստի գործեր ստեղծելու համար։.

🔗 Արհեստական ​​բանականության կողմից ստեղծված արվեստի արշալույսը. ստեղծագործականության ազատագրում, թե՞ հակասությունների հրահրում
Արհեստական ​​բանականության կողմից ստեղծված արվեստի շուրջ ստեղծագործականության, էթիկայի և բանավեճերի ուսումնասիրություն։.

🔗 Գրաֆիկական դիզայնի լավագույն արհեստական ​​ինտելեկտի գործիքները. Արհեստական ​​ինտելեկտով աշխատող լավագույն դիզայնի ծրագրեր
Բացահայտեք հզոր արհեստական ​​բանականության գործիքներ, որոնք վերափոխում են ժամանակակից գրաֆիկական դիզայնի աշխատանքային հոսքերը։.


Ի՞նչն է արհեստական ​​բանականության համար նախատեսված գեղարվեստական ​​ոճերը դարձնում իրականում լավը։ ✨

Մոդելների ընտրությունը պարզապես միտումների հետևից վազելը չէ։ Որոշ ոճերի մոդելների համար պարզապես ավելի հեշտ է հետևել դրանց։ Մի քանի պատճառ՝

  • Պարզություն - իսկապես տարբեր «կանոններով» ոճերը (կուբիզմի ճեղքված երկրաչափությունը, մանգայի գծերով ծանր վահանակները) ավելի կրկնվող են, քանի որ թիրախային տեսողականները այդքան շատ չեն շեղվում [3][4]:

  • Ճկունություն - խառնուրդներին հարմար ոճերը (օրինակ՝ «կիբերպանկ + ռեալիզմ») թույլ են տալիս ժամանակակից դիֆուզիոն մոդելներին հենվել խաչաձև ուշադրության վրա՝ իրերը մաքուր խառնելու համար [1]:

  • Ճանաչելիություն - ոճերը, որոնք մարզումների տվյալները հազար անգամ տեսել են (անիմե, իմպրեսիոնիզմ, ֆոտոռեալիզմ), ավելի ճշգրիտ են արտացոլվում [2]:

  • Տրամադրություն/Մթնոլորտ - «մելանխոլիկ», «հանգիստ» կամ «նեոնային լուսավորությամբ» բառերը հուսալիորեն փոխում են լուսավորությունը, գունապնակը և կոմպոզիցիան միտումնավոր զգացվող ձևերով [5]:

Նպատակը որևէ կլինիկական «ճշգրտություն» չէ: Այն ոճն է՝ որպես ձեր տրամադրության կամ պատմության կոնտեյներ, և մոդելին հուշելու սովորելը, որպեսզի այն կարողանա կրկին ու կրկին հայտնվել այդ կոնտեյներում:.


Ինչպես է արհեստական ​​բանականությունը «տեսնում» ոճը (պարզ տարբերակ, առանց ժարգոնի գերբեռնվածության)

Ժամանակակից տեքստից պատկեր մոդելները համատեղում են երեք բան՝

  1. Տեքստ-պատկեր համապատասխանեցում - CLIP-ի նման համակարգերը սովորում են, թե «որ բառերն են համապատասխանում որ տեսքին»։ Այսպիսով, երբ դուք ասում եք «կոպիտ թանաքի լվացում», այն այդ արտահայտությունը կապում է տեսողականի հետ [3]:

  2. Դիֆուզիա թաքնված տարածությունում - Ներքևում, թաքնված դիֆուզիան աստիճանաբար սրում է աղմկոտ պատկերը ձեր նկարագրությանը համապատասխան: Ահա թե ինչպես է այն ձեռք բերում և՛ արդյունավետություն, և՛ վերահսկողություն [1]:

  3. Արագ փոփոխիչներ - Փոքրիկ «համայնքային հնարքները»՝ կինեմատոգրաֆիկ լուսավորությունը, եզրային լուսավորությունը, բարձր կոնտրաստային ֆիլմի հատիկավորությունը, նման են կարգավորվող ցուցանակների, որոնք կարող եք դարսել միմյանց վրա [5]:

Ինչու է սա կարևոր. Եթե ոճը հստակորեն գոյություն ունի մարզման տվյալներում , և դուք այն նկարագրում եք ճիշտ հավելումներով, ապա արագ կստանաք կայուն արդյունքներ [1][2][5]:


Համեմատական ​​աղյուսակ. Արհեստական ​​բանականության համար հայտնի գեղարվեստական ​​ոճեր 🖌️

Անկարգ, բայց օգտակար խաբուսիկ թերթիկ է գալիս

Արվեստի ոճ Լսարան Գին (AI գործիքներ) Ինչու է այն աշխատում
Ռեալիզմ Լուսանկարիչներ, ապրանքանիշեր Անվճար – $$$ Հղկված և հուսալի տեսք ունի
Անիմե/Մանգա Երիտասարդ երկրպագուներ, խաղացողներ Անվճար - միջին գնով Ուժեղ գծային կառուցվածք; անմիջապես ընթեռնելի
Սյուրռեալիզմ Ստեղծագործողներ, երազողներ Ազատի նման Տարօրինակ խառնուրդները լավ են համապատասխանում դիֆուզիային
Կիբերպանկ Տեխնոլոգիաների սիրահարներ, ֆուտուրիստներ Հաճախ անվճար հավելումներ Նեոն + կոնտրաստ = ակնթարթային «վա՜յ» գործոն ⚡
Իմպրեսիոնիզմ Արվեստի սիրահարներ Միջին արժեք Թեթև + վրձնագույն հյուսվածքները հարմար են մոդելների համար
Ցածր պոլի 3D Դիզայներներ, մշակողներ Բազմազան Պարզ երկրաչափությունը պահպանում է արդյունքների հետևողականությունը
Պիքսելային արվեստ Խաղացողներ, նոստալգիայի սիրահարներ Անվճար (հիմնականում) Կոշտ սահմանափակումների ուղեցույցի կազմը

Դաշտային խզբզոց. կիբերպանկի դեպքում «մեղմ եզրային լույս + ծավալային մշուշ» առարկաները դարձնում է ավելի աչքի ընկնող։ Պիքսելային արվեստի դեպքում այն ​​ամրացրեք «8-բիթ, 32×32, սահմանափակ պալիտրա» ՝ չափազանց մաքուր արդյունքներից խուսափելու համար։


Խորը վերլուծություն. Ռեալիզմ ընդդեմ սյուրռեալիզմի 🎭

Ռեալիզմը համամասնությունների և մանրամասների մասին է՝ կատարյալ է մարքեթինգային մրցույթների կամ արտադրանքի դիզայնի համար, որտեղ կարևոր է հավաստիությունը: Լուսանկարչական իրականությունը, մակերեսային ազատ տարածքը, ստուդիական լուսավորությունը, 85 մմ օբյեկտիվը արհեստական ​​ինտելեկտին տալիս են հստակ տեխնիկական հենարաններ:

Մյուս կողմից, սյուրռեալիզմը երազային, անհնարին երկրաչափություն, Էշերի ոճով ։


Անիմե և Մանգա։ Արհեստական ​​բանականության սիրելին 🌸

Անիմեն/մանգան գրեթե անարդարացիորեն արդյունավետ է։ Սահմանված գծայինը, բջիջների ստվերավորումը և պաշտամունքային համամասնությունները մոդելին տալիս են ֆիքսված ձևանմուշ, բացի այդ, դա ծիծաղելիորեն տարածված է մարզման տվյալներում [2]: Իսկ հիբրիդները՞: Ոսկի: Փորձեք կիբերպանկ անիմե սամուրայ կամ սթիմպանկ մանգա դետեկտիվ :

Հուշեք կառամատույցներ հենվելու համար

  • «Անիմեի հիմնական վիզուալ, դինամիկ դիրք, մաքուր գծային պատկեր, սելֆինգ, արտահայտիչ աչքեր, մանրամասն ֆոն»

  • «մանգա վահանակ, էկրանի երանգավորում, հոլանդական անկյուն, թանաքի շեշտադրում»

Նշում ինքներդ ձեզ համար. Եթե ​​արտադրված պատկերները մշուշոտ են թվում, ավելացրեք «մաքուր գծային, հարթ ստվերաներկ» կամ սահմանափակեք գույները «սահմանափակ պալիտրա»-ով:


Կիբերպանկ և ֆուտուրիստական ​​ոճեր ⚡

Նեոնային ցուցանակներ, քրոմապատ արտացոլանքներ, անձրևոտ գիշերներ՝ մոդելը կլանում է այս ամենը: Diffusion-ը հիանալի կերպով համատեղում է բարձր կոնտրաստային լուսավորությունը + անդրադարձնող նյութերը «նեոնային լուսավորությամբ նրբանցք, ծավալային մառախուղ, ջրափոսի արտացոլանքներ» նման հուշումները հաճախ պաստառի նման տեսք ունեն:

Հուշում ուղղելու համար. Մոմեմանման մակերեսներ՞: Հուշման մեջ «ենթամակերևութային ցրում, թաղանթային դասակարգում»


Իմպրեսիոնիզմ և գեղանկարչական հյուսվածքներ 🎨

Այստեղ մանրամասները թագավոր չեն։ Իմպրեսիոնիզմը ծաղկում է մեղմ եզրերի, կոտրված գույների և լույսի խաղի վրա։ Տեսանելի վրձնահարվածների, պլեներային լուսավորության, ոսկե ժամի նման հուշումները լավ են աշխատում։ Մոդելը մանրամասնություն է առաջարկում առանց չափազանց մեծ ռենդերինգի, ինչը, զվարճալի է, և՛ իսկական է, և՛ հաշվողականորեն հեշտ [4]:


Մինիմալիզմ, պիքսելային արվեստ և ռետրո 🕹️

Սահմանափակումները պարզեցնում են։ Ցածր պոլի-ն հիմնված է երկրաչափական պարզության վրա, իսկ պիքսելային արվեստը ամրագրված է լուծաչափով + պալիտրաով։

Օգտակար հուշումների շրջանակներ՝

  • «ցածր պոլի դիորամա, կոշտ եզրեր, հարթ ստվերում, շրջապատող օկլյուզիա»

  • «պիքսելային արտ, 32×32 սփրայթ, NES ոճ, սահմանափակ տատանում»

Կողմնակի նշում. Եթե պիքսելային արվեստը չափազանց սահուն է թվում, անալոգային ճշգրտության համար «CRT սկանավոր գծեր, խամրած ստվերներ»


Հիբրիդային միախառնումներ. Որտեղ է արհեստական ​​բանականությունը փայլում ✨

Վայրի քարտ՝ խաչաձև փոշոտում: Diffusion-ը թույլ է տալիս միավորել այնպիսի ազդեցություններ, որոնց մեծ մասը չէր անդրադառնա՝ Վան Գոգի կիբերպանկ , անիմե նուար կուբիզմ , Վերածննդի մեքա-հրեշտակ: Սա նման է նեյրոնային ոճի փոխանցման 2.0-ին, բայց շատ ավելի կառավարելի է [1][4]:

Բաղադրատոմսի ձևաչափը՝
[Թեմա] + [Դարաշրջան/Շարժում] + [Լուսավորություն] + [Միջոց/Նյութ] + [Կոմպոզիցիա] + [Պալիտրա/Տրամադրություն]

Օրինակ՝ «ջութակահարը տանիքին - իմպրեսիոնիստական ​​յուղաներկ - ոսկե ժամի լուսավորություն - կենտրոնից դուրս - նոստալգիկ պալիտրա»:


Հուշումային օրինաչափություններ, որոնք իրականում փոխում են արդյունքները 🛠️

Կրկնակի փորձնական վազքերից՝

  1. Միջին + ոճի զուգակցումը պարզաբանում է եզրերը/տեքստուրաները՝ յուղային սյուրռեալիզմ, թվային մանգա [5]:

  2. «Լուսավորությունն առաջինը» ռեալիզմն ավելի շատ է փոխում, քան բառերի կուտակումը։

  3. Տեսախցիկի լեզուն (անկյունները, օբյեկտիվի երկարությունը) ապահովում է ակնթարթային կանխատեսելիություն։

  4. Սահմանափակումները կարևոր են՝ մինիմալիզմի կամ պիքսելային արվեստի համար բացահայտորեն պարտադրում են լուծաչափը/պալիտրաը։

  5. Փոքր խմբագրումներ > Մեծ վերաշարադրումներ ։ «Նեոն» → «նատրիում-գոլորշի» փոխարինումը հաճախ ավելի արդյունավետ է, քան լրիվ վերանորոգումը [5]:


Արագ իրականության ստուգում 🔍

  • Կողմնակալություն - Առցանց տարածված ոճերը (անիմե, ֆոտոռեալիզմ) գերակշռում են արդյունքներում. հազվագյուտները կարիք ունեն հղումների կամ ճշգրտման [2]:

  • Ինչու է Surreal-ը աշխատում - Diffusion-ի ազատությունը թաքցնում է անատոմիայի բացթողումները՝ տարօրինակ բաները դարձնելով միտումնավոր արված [1]:

  • Հրահանգի շեղում - Եթե բոլոր արդյունքները նույնն են թվում, թեման վերանայելուց առաջ փոփոխեք մոդիֆիկատորները [5]:

  • Իրավունքներ/Էթիկա - Տվյալների հավաքածուները լայնորեն մշակվում են. արդյունքները պետք է օգտագործվեն պատասխանատու կերպով, հատկապես առևտրային նպատակներով [2]:


Փոքրիկ նշումներ (իմ ավազարկղից) 🧪

  • Կիբերպանկ Դիմանկար - «դիմանկար, կապտականաչավուն-մանուշակագույն նեոն, անձրևոտ նրբանցք, եզրագծի լույս, 85 մմ, կինեմատոգրաֆիկ բոքե»:
    Աշխատեց, քանի որ. օբյեկտիվը + լուսավորությունը ճշգրիտ տարանջատեցին օբյեկտիվը/ֆոնը։

  • Իմպրեսիոնիստական ​​բնապատկեր - «գետափը ոսկե ժամին, իմպրեսիոնիստական ​​յուղաներկ, տեսանելի վրձնի հարվածներ»:
    Աշխատեց, քանի որ. միջին ամրացված հյուսվածք, լուսավորություն, որը մշակված է ջերմությամբ։

  • Pixel-Art Creature - «32×32 պիքսելային վիշապ, սահմանափակ տատանում, 1-px ուրվագիծ, իզոմետրիկ»
    : Աշխատեց, քանի որ սահմանափակումները դադարեցին հարթեցնելը։


Արագ հղումներ (պատճենել/տեղադրել)

  • Ռեալիզմ (արտադրանք). «ստուդիական լուսանկար, փափուկ տուփի լուսավորություն, 50 մմ օբյեկտիվ, փայլուն կերամիկա, մաքուր սվաղ»

  • Անիմե գործողություն. «անիմեի հիմնական վիզուալ, կրճատված դինամիկ դիրք, բջջային ստվերաներկ, արագության գծեր»

  • Սյուրռեալիստական ​​կոլաժ. «երազային տեսարան, անհնարին երկրաչափություն, լողացող աստիճաններ, մեղմ մառախուղ, ոսկե ժամի լույսի հատիկ»

  • Ցածր պոլի-տեսարան. «իզոմետրիկ ցածր պոլի-քաղաք, հարթ ստվերում, շրջակա միջավայրի օկլյուզիա, պաստելային պալիտրա»

  • Իմպրեսիոնիստական ​​դիմանկար. «յուղաներկ կտավի վրա, ազատ վրձնագործություն, եզրային լույս, իմպաստոյի շեշտադրումներ»


Ամփոփում 🖼️

«Արհեստական ​​ինտելեկտի համար արվեստի ոճերը» կանոնների գրքեր չեն, դրանք խաղահրապարակներ են։ Ռեալիզմը գործում է, երբ վստահությունը կարևոր է. սյուրռեալիզմը, երբ ուզում եք կոտրել իրականությունը. անիմե/մանգան, երբ ձեզ անհրաժեշտ է պարզություն՝ ոճերը խառնելու հնարավորությունով։ Հաղթական ռազմավարությունը կառուցվածքային խաղն է. ընտրեք ոճ, ընտրեք լուսավորություն + միջավայր, ավելացրեք մի քանի մոդիֆիկատորներ, ապա կրկնեք։ Եթե դա ձեզ ինչ-որ բան է զգացնում, նույնիսկ եթե այն տարօրինակ կերպով անկատար է, ապա դուք ճիշտ ուղղությամբ եք շարժվում։


Հղումներ

[1] Ռոմբախ, Ռ. և այլք (2022): Բարձր թույլտվությամբ պատկերի սինթեզ թաքնված դիֆուզիոն մոդելներով (CVPR): PDF
[2] Շուման, Ք. և այլք (2022): LAION-5B. Բաց լայնածավալ տվյալների հավաքածու՝ հաջորդ սերնդի պատկեր-տեքստ մոդելների մարզման համար: PDF
[3] Ռադֆորդ, Ա. և այլք (2021): Փոխանցելի տեսողական մոդելների ուսուցում բնական լեզվի վերահսկողությունից (CLIP): PDF
[4] Գատիս, Լ. և այլք (2016): Պատկերի ոճի փոխանցում՝ օգտագործելով կոնվոլյուցիոն նեյրոնային ցանցեր (CVPR): PDF
[5] Օպենլենդեր, Ջ. (2024): Տեքստը պատկերի վերածելու համար հուշումների մոդիֆիկատորների տաքսոնոմիա: Վարքագիծ և տեղեկատվական տեխնոլոգիաներ: Հոդված


Գտեք արհեստական ​​բանականության վերջին նորույթները պաշտոնական արհեստական ​​բանականության օգնականների խանութում

Մեր մասին

Վերադառնալ բլոգ