mjrobot

Tuleb taaskord tõdeda, et ulmekirjandus on alati olnud alati legendaarselt halb tuleviku ette ennustamises. Ma isiklikult muidugi arvan, et see polegi tema ülesanne, pealegi on ka futuristid suutnud enamasti samamoodi ja veelgi hullemini mööda põrutada. Kuid sellegipoolest ei saa eirata, et arvutid on üks asi, millega on nii kirjandus kui futuroloogid eriti hädas olnud. Tasub kasvõi meenutada, et küberpungi žanr tekkis hetkel, kui USA-s oli juba müüdud sadu tuhandeid koduarvuteid ja toimis ka algeline fännide loodud Interneti eelane. Samamoodi usuti, et AI tuleb massiliselt kasutusse alles kunagi 21 sajandi teises pooles ja pigem hakkab AI võtma ära just lihtsamaid töid. See pole sugugi uus arvamus, eks isegi Karel Čapeki „R.U.R-is“ ju tegid suured kobakad robotid raske töö inimeste ees tehases ära. Töölised aga vaesusid. Igasugune kunst, looming, kirjandus, skulptuur jms kaunis leiti ühesõnaga jäävat alatiseks inimeste pärusmaaks. Meenub kasvõi „Gorth Ashryn“, kus Leo Kunnas arvas, et tehismõistus võib küll olla miljoni inimaju võimekusega, aga lahinguid ta planeerida ei suuda. Sel suvel selgus aga kurb tõsiasi, et kõige esmalt langevad hoobi alla justnimelt need loomingulisemad alad ja kui pisut tagantjärele mõelda, siis on sellel ka üsna loogiline selgitus. Isesõitev auto (või viljakoristusrobot või tänavapühkimiseautomaat jne) vajab spetsiaalset kallist riistvara ja ta peab olema seejuures peaaegu veatu. Ehk auto peab suutma iga ilmaga eristada teel vedelevat pappkarpi kõrtsist tulnud korporandist. Kunstirobotile sedavõrd suuri tingimusi ei seata, pole probleemi, kui ta vahel joonistab nina lõua asemele või silma küünarnukile. Keegi sellest haiget ei saa (vähemalt mitte füüsiliselt, kunstimeelega on iseasi). Lisaks ei vaja ta ka spetsiaalset kallist riistvara. Kasutada saab juba olemasolevat pilvearvutusteenust ja vanu graafikakaarte, mis peale elektrihinna tõusu krüpto kaevandamiseks enam ei kõlba. Väga oluline eeldus oli kahtlemata ka möödunud suvel paljuski nii pea- kui sotsmeedias tähelepanuta jäänud teatel, et valminud on täiesti uus GPT3nimeline AI mudel, mis saab oma eellastega võrreldes inimkeelest suurusjärgu võrra paremini aru. Just see GPT3 kujutas endast praeguse AI plahvatuse üht esimesi ja kõige olulisemaid läbimurdeid, sest inimkeeles antud käskluste mõistmise puudumine on peamine, mis on takistanud masinatel seni keerukaid ülesandeid lahendada.

Loomulikult on see tehnika tekitanud ka küsimusi moraali ja autoriõiguste osas. Neid teemasid ma selles artiklis käsitleda ei kavatse. Miks? Sest ma ei näe sellel mõtet. Mis puutub kunstnike õigusi ja nende tööde ärakasutamist, siis küllap nii või naa lahendus leitakse. Kas siis hakatakse maksma iga pildi pealt (mis oleks kõvasti suurem summa kui autorihüvitusfond praegu kirjanikele jagab) või treenima spetsiaalseid mudeleid vaid autoriõigustevaba materjali pealt. Muus osas võib hädaldada, protestida, kohut käia, aga ei saanud ka peatada raudteed, grammofoni, raadiot, televisiooni ega internetti.

Midjourney, millest allpool jutt on,  pole isegi mitte ainus AI pildiloomise tarkvara. On veel Dall-E, Stable Diffusion (mille saab muide paigaldada ka enda arvutisse), ja arendusel on veel vähemalt kolm-neli-viis asja, millede nimesid ma ei mäleta ja ei viitsi praegu ka kontrollida. Lisaks on olemas juturakendus ChatGPT, arenduses on AI, mis teeb muusikat, valmistab filme jne. Praeguseks on juba ilmunud ka esimene eesti autori ulmeraamat, mis kasutab kaanel AI kunsti, ja on olemas ka esimene Eestis loodud arvutimäng, kus on samuti suur osa piltidest (autorite enda jutu järgi kogunisti 1500 tükki) masingenereeritud. Seega näeme tulevikus kahtlemata nii kohalikus kui ka suures mainstream-massimeedias üha rohkem ja paremat mudelitega loodud kunsti ja seda lihtsalt pudelisse tagasi ei topi. Tee, mida sa tahad.

Kuid liigume edasi selle artikli põhiteemale ehk kuidas treenitud neurovõrguga õigupoolest see AI-kunsti tegemine käib.

Ise olen kasutanud kõige rohkem Midjourney nimelist teenust. Tegemist on firmaga, mille lõi David Holz. Laiemale publikule avati MJ tarkvara alles selle aasta juulis. Kui palju on Midjourney viimase poole aasta jooksul arenenud, näeb ilusti kolmest allpool olevast pildist.

grid 0 (7)
grid 0 (6)
Metsavana anarchist bar 1914s noir a36f88d4-4da0-4961-9312-869a5e089463

Esimene neist on tehtud MJ v2 abil. Teine ning kolmas on esimese MJv3 ja MJv4 abil loodud ümbertöötlused.

Esmalt on vaja teada, et MJ pole arvutisse paigaldatav iseseisev rakendus. Selle kasutamine käib läbi Discordi nimelises programmis oleva boti. Discord on põhimõtteliselt IRC-d meenutav vestlusrakendus, kus saab liituda erinevate kanalitega või neid ise luua ja Midjourney on sinna tekitanud vestlusroboti, mis saab käsklustest aru ja genereerib selle alusel otse jutuaknasse pilte. Seega tuleks alustuseks hankida endale Discord ehk minna lehele https://discord.com/, registreerida endale kasutajakonto ja tõmmata rakendus arvutisse.

Kui Discordi konto olemas ja rakendus käima pandud, tuleb ka MJ-botiga sõbraks saada ehk minna lehele https://www.midjourney.com/, valida sealt „Join to beta“ ja registreerida end Midjourney kasutajaks.

Liitudes on võimalik valida nelja erineva paketi vahel. Kõige esimene ehk „free trial“ annab tasuta 25 minuti jagu ehk sõltuvalt seadistustest  kahe tosina pildi loomise jagu kasutusaega. Basic-pakett, mis maksab 10 eurot kuus, pikendab seda 200 minutini, mida on tõsisemaks katsetamiseks endiselt vähe. Ise olen kasutanud Standard-paketti, mis maksab küll 30 eurot + km kuus, kuid mis annab 15 tundi nö kiiret „fast time"-kasutusaega ja võimaldab kasutada ka „relax mode’i“. Viimane tähendab seda, et kui sul on „fast time” otsa saanud, saad ümber lülitudarelax-režiimile ja valmistada seal juba piiramatus koguses pilte edasi. Konks seisneb selles, et „relax mode“ on mitu korda aeglasem. Ehk kui fast-režiimis olles hakatakse pilti genereerima loetud sekunditega, võib relax-režiimis kulutada vastavalt serveri koormatusest minuteid. Samas on aga alati võimalus panna korraga kuni 8 erinevat pilti tegemisjärjekorda ja sellevõrra pisut töötlust kiirendada.

Piltide loomine käib Discordi vestlusaknasse trükitud käskude abil. Kasutaja loomise järel saadetakse automaatselt kutse Midjourney kanaliga liitumiseks ja alguses on ilmselt hea mõnes sealses algajatele mõeldud kanalis nö „jämmida". Ise soovitaksin luua Discordis omaenda kanal ja kutsuda käsklusi töötlev Midjourney-bot sinna. Selliselt on ekraanil teiste kasutajate läbu vähem ja keskenduda lihtsam. Nii, oma Discordi kanali (Discordi keeles serveri) tegemine on üsna lihtne. Serveri tegemiseks tuleb vajutada Diskordi rakenduses vasakul ribal olevale + märgiga nupule „Add a Server" ja bot’i saab sinna kutsuda Discordi kanalis Midjourney Bot nimelise kasutaja peal „Add to Server" vajutades.

Kui need liigutused tehtud, tuleks järgnevalt kindlasti vaadata üle seadistused. Selleks tuleks trükkida jutusisestamise aknasse käsk: "/settings", misjärel peaks avanema järgmine nupupaneel.

pilt3

Lisaks režiimide vahetusele saab siit muuta ka kasutusolevat MJ-versiooni. Ehk öelda, mis mootorit ta piltide genereerimiseks kasutama peaks. Nagu võib juba oletada, siis mida uuem versioon, seda parem. Ehk antud hetkel tasuks kindlasti kontrollida, et kasutusel oleks V4, kuna see saab kasutajate soovidest kõige paremini aru ja suudab seetõttu luua ka kõige paremaid pilte. Proovida võib aga ka vanemaid mudeleid (eriti kui huvi sürreaalsemate tulemuste vastu) ja üsna huvitav on kahtlemata spetsiaalselt anime-stiilis piltide loomiseks treenitud versioon nimega „niji“.

Piltide loomiseks on käsk „/imagine", mille järele tuleb trükkida loodava pildi kirjeldus. Näiteks:

/imagine asteroid miners

pilt1

Nupud U1-U4 võimaldavad saadud tulemusi "upscaleda" ehk genereerida suurema resolutsiooniga versiooni. V1-V4 annavad võimaluse igast pildist omakorda veel neli erinevat versiooni luua. Juhul kui seadistustest on remix sisse lülitatud saab ka genereerimiseks kasutatud kesklust muuta või täiendada.

pilt2

Vaikimisi on kõik MJ-pildid ruudukujulised ja üsna ruttu tekib soov saada ka laiemaid või kõrgemaid pilte. Seda enam, et ohtralt detaile sisaldaval pildil aitab laiem formaat ka MJ-l endal asju paremini ära mahutada. Kõrguse ja laiuse suhte muutmiseks võib lisada nt järgneva parameetri:

/imagine asteroid miners --ar 3:2

pilt4

Ja selle suurendatud versioon.

Metsavana asteroid miners f6c6d40e-eff6-428f-8f71-fcd7ec53e3ba

Tasub tähele panna, et hea käsklus on võimalikult lühike ja lööv: kass lakub piima, atleet tõstab kangi, krahv joob teed, tüdruk vaatab kuud jne. Mida selgem ja arusaadavam, seda suurem tõenäosus on ka hea tulemus saada. Mitmelauselised ja keerukad käsud annavad harva häid tulemusi. Samuti liiga paljude objektide ja esemete üheaegne nõudmine. Nii on üsnagi vähetõenäoline saada hea tulemus käsuga: tüdruk vaatab kuud, aga kass sööb vorsti. Mitme tegelase puhul kehtib sama lihtsuse reegel. Ehk „kolm kassi lakuvad piima“ võib anda hea tulemuse, aga kolm kassi, kellest üks must, teine valge ja kolmas kirju, lakuvad piima, on masinale raske. Probleem on sageli ka detailides ehk MJ võib valmistada suurepärase sõduri, aga õiget piipu talle käte vahele luua enam ei mõista. Seega vähemalt esialgu (või vähemalt kuni viienda versioonini) pole suurt lootust saada nt pilti, kus piipu suitsetav Tarzan võitleb King Kongiga. Kuigi Tarzani ega King Kongi eraldi loomisega tal väga suurt raskust pole. Üldiselt tasub olla kannatlik, proovida mitu korda, muuta kirjeldust ja lisatud märksõnu ja arvestada sellega, et sajaprotsendiliselt sellist pilti, nagu sul peas on, pole sageli võimalik MJ käest saada. Või on see vahel arutult aeganõudev.

Kirjeldust saab parema pildi saamiseks täiendada komadega eraldatud täpsustustega. Kõige levinumaks on ilmselt lisada, mis stiilis võiks pilt olla. Kas pliiatsijoonistus (pencil drawing), õlimaal (oil painting), fresko (fresco), koopamaal (cave painting) või skulptuur (sculpture). Vahel aitab ka, kui lisada veel ka mõningaid atmosfääri suunavaid märksõnu nagu näiteks realistic, epic, atmospheric, romantic ja täpsustada, kas stseen toimub hommikul, päeval või öösel. Et stseen on üles võetud „dimly lit room".
Võib küsida ka mustvalge illustratsiooni „black and white illustration“ või „pulp magazine cover

Üleüldiselt võib täiendavate märksõnade kohta öelda, et piiranguks on ainult fantaasia. Mingit ammendavat kataloogi selles osas pole ja saab rõõmuga katsetada, et mis võtmesõnad omavahel koos võivad milliseid tulemusi anda. Tasub tähele panna ka seda, et kõik märksõnad pole kunagi sama kaalukategooriaga. Mõnest ei saa MJ üldse aru. Teise puhul aga võib ta juba üheainsa sõna peale hakata looma erakordselt fantaasiarikkaid tulemusi või piisab selle sõna lisamisest, et pilt muutuks tundmatuseni. Näiteks noorte naiste pilte on talt küsitud lõputult ja see on tal ka hästi treenitud omadus. Käed ja eriti sõrmed on muidugi legendaarselt halvad, selle üle on palju meeme tehtud. Ja muidugi ka numbrid ja tähed. Kuigi inglise keelest saab MJ talutavalt aru, ei suuda ta ise veel kirjutada. Küllap aga need asjad paranevad, tasub kerida ülespoole ja vaadata, millised olid käed vaid versioon varem, valdavalt mingid labidalaadsed moodustised, mis kippusid igale poole sisse sulanduma. On kohe näha, kui suur arenguhüpe on toimunud. Küllap ta nende sõrmede asendid ja arvud ka selgeks saab.

320678767 1422337925199196 2078443434362984272 n

Pilte mõjutavad väga tugevalt ka käsku lisatud kunstnike nimed. Ehk piisab sageli vaid Miyazaki, Beksinski või Junji Ito nimest, et pildi stiil tundmatuseni muutuks, aga eks see on ka koht, kus nüüd läheme moraalselt pehmele pinnasele ja seetõttu mainin, et on olemas ka palju autoriõiguste alt vabu autoreid ehk siis näiteks mulle endale meeldib väga Theodor Kittelsen, kelle nime lisamine annab vahvat „Eesti rahva ennemuistsete juttude“ õhustikku. Paar näidet:

grid 0 (31)

/imagine iron made demon soldier, highly detailed, retro, wood engraving, soft colors, epic Theodor Kittelsen --ar 3:2

grid 0 (356)

/imagine hairy old devil with horns in the small hill looking down to foggy fields and forrest, highly detailed, retro, wood engraving, soft colors, epic Theodor Kittelsen --ar 3:"

Omaette teema on veel fotorealism ja filmidest inspireeritud MJ-pildid. Selleks, et sundida MJ fotorealistlikke pilte tegema, piisab nt juba, kui prompti lisada „professional photo". Täpsustada võib ka, et kas see on värviline või mustvalge. Samuti, kas tegemist polaroidi fotoga jms.

Eksperimentaatorid on märganud, et pilte muudab ka erinevaks, kui kaameraid täpsemalt kirjeldada, nt Sony, Canon, Kodak. Kvaliteedi tõstmiseks võib alati lisada veel 3200dpi scan jne.

Kombineerides näiteks professional photo märksõnaga „Finno-ugric" võib saada kohati lausa üllatavalt ilusaid, aga samas väga detailseid pilte, mis võiks olla vabalt pildistatud mõnes Eesti unustatud kohas.

grid 0 (314)

/imagine professional photograph of old log finno-ugric village in summer morning moody fog --ar 3:2

grid 0 (37)

/imgine professional photograph of finno-ugric tree alley in summer morning moody fog --ar 3:2

grid 0 (321)

/imagine establishing shot from a finno-ugric train station in 1881 in rural small village with steam traim. 80s movie still. Photography, film, sony, portra, kodak Polaroid 3200dpi scan medium format film Portra 800 --ar 3:"


Filmilikumaks saab pilte (lausa nii filmilikuks, et võivad esmapilgul ära petta ja panna uskuma, et tegemist ongi mõnest filmist pärit kaadriga), kui kasutada märksõnu „Screencapture" või „establishing shot".

grid 0 (36)

/imagine establishing shot from a movie about 1932 russia scientist who invented space rocket. 80s movie still. Photography, 35mm film --ar 3:2

c979b857dc697fa5

/imagine establishing shot from 1960 italy horror movie by Mario Bava called Black Sunday --ar 3:2

grid 0 (41)

grid 0 (40)

/imagine establishing shot from a cyberpunk sci-fi movie Johnny Mnemonic. 80s movie still. Photography, film, sony, portra, kodak Polaroid 3200dpi scan medium format film Portra 800 --ar 3:2


Tasub kindlasti meeles pidada, et tegemist on jätkuvalt masinaga, millel pole inimmaailmast väga selget arusaama või ehk üldse mitte ja mõned liiga keerukad kontseptsioonid jäävad vaid tekstilise kirjelduse abil tema käeulatusest välja. Vahel võib aidata, kui lisada url-i sobiv pilt, millel kujutatud tulemust, mida tahad saada.

pildilink


/imagine http://veebileht.ee/pilt.jpg mercenary of Nordic origin standing in the honor of the jungle and lighting a cigarette with a machine gun over his shoulder, smoking a cigarette --ar 3:2


Võiks veel omajagu erinevatest märksõnadest kirjutada, kuid alustuseks peaks juba piisama. Kui huvi, siis ka Midjourney enda ametlikul lehel on mõned neist ära toodud: https://midjourney.gitbook.io/docs/resource-links/guide-to-prompting

Kuigi alustasin seda artiklit ulmeautorite võimetusega asju ette ennustada, ei suuda minagi vastu panna ja tahaks kirjutada lõpetuseks ka tulevikust. AI-de areng on olnud väga kiire. Nagu ülalpool sai öeldud, tuli alles mõni nädal tagasi välja ka ChatGPT-nimeline vestlusprogramm, mis mõistab isegi eesti keelt ja suudab algaja tasemel esseesid, artikleid ja kehvi luuletusi kirjutada. Võimalik, et mingi hetk hakkavad autorid laskma AI-l luua kirjeldusi ja terveid lõike. Ise AI veel niipea terviklikku raamatut ei loo, aga sellise abistava tegevusega võib ta üsna pea hakkama saada. Töös on veel mitu pildigenereerimise AI-d, tulevikus lubatakse ka muusika jaoks oma rakendust.

Kahtlemata on üks asi, kus neurovõrgud leiavad ohtralt rakendust, programmeerimine. Olen juba isegi AI tehtud skripte edukalt töös rakendanud. Kuid üks võib-olla kõige huvitavam asi, mis töös, on neurovõrkude lahendused, mis suudavad genereerida pilte kiirusega 30 kaadrit sekundis. See on juba piisav kiirus, et luua reaalajas videopilti. Ehk siis võimalus genereerida jooksvalt mitte ainult filme, vaid ka videomänge. Kuna ma olen ulmekirjanik, siis ma ei oska ennustada, mis sealt võib veel areneda, aga nagu alguses öeldud, seda tehnikat enam sinna, kust ta tuli, tagasi ei topi. Kahtlemata näeme veelgi rabavamaid tehnoloogiaid kui MJ ja näeme ka ühtlasi veel suuremaid nende masinate vastaseid proteste.

Internetis levib ohtralt kirjutisi, kus kardetakse, et lõpuks asendab AI igasuguse inimloomingu. Mina seda ei usu. MJ-promptide taga on endiselt inimeste ajutegevus ja fantaasia, mis seda suunab. Ehk kõik taandub lõpuks ikkagi inimeste loomingulisusele nagu varemalt. Hetkeks lähevad kaardid segi ja inimeste pead koos nendega. Kuid see paistab mulle ajutise paanikana, mis valitses ka peale kuulipilduja või pommituslennuki esmakordset nägemist ja loodeti, et kõik sõjad kaovad maailmast ära, sest tehnika muudab nende pidamise lihtsalt võimatuks. Reaalselt kirjutab igasugust teadvust mitteomav masin ilma väga tugeva suunamiseta vägagi banaalseid tekste ja loob igavaid pilte. Esmalt võib see kõik paista tore, kuid inimestel tekib kiirelt küllastumus. Tunnen juba praegugi, et esimene „ohoo-ja-ahaa“ vaimustus käib maha. Varem näitasid mingit karvast mätast ja ütlesid, et AI tegi, ja kõigil läksid silmad pungi. Nüüd peab märksa rohkem pingutama, sest uudsuse faktor on kadunud, silmad aga harjunud paremini AI loodud defekte märkama (põhimõtteliselt toimub sama protsess, mis kunagi CGI ja 3D-ga). Lõpuks jääb looming ikkagi loominguliste inimeste alaks. Mingid tehnoloogiad muutuvad aga kättesaadavamaks kui varem ja teatud kunstiliikidesse sisenemise lävepakk, mis oli varem ületamatult kõrgel, langeb kolinal alla. Üks autor saab raamatu kirjutamisega võrdse ajaga luua pädeva arvutimängu või teha lühifilmi ehk teha asju, mis varem nõudsid raha, suurt meeskonda ja keerukaid tehnilisi teadmisi. Tänapäeva aina visualiseeruvas maailmas paratamatu ja ehk ka õige suund, sest tehnoloogia annab nii võimaluse suurte lõputult rikaste korporatsioonidega võistelda. Maailm on hetkel nii paika loksunud, et raamatuid kirjutada ja muusikat luua saab üsna üksi, aga loo visuaalne jutustamine on liiga keerukas. Samas inimesed tänapäeva närvilises ühiskonnas eelistavad just rohkem visuaalset meediat. Eks muidugi näeb, mis saab. Hetkel on edasiliikumine olnud peadpööritavalt kiire ja lähiaastad saavad kahtlemata olema AI tehnoloogias murrangulised.

 

bb5913292f510de3

Reaktori tööle saab kaasa aidata igaüks! Saada oma jutt, artikkel, arvustus, uudisvihje, arvamus või muu kaastöö toimetuse aadressile toimetus@ulmeajakiri.ee.
© Kõik jutud on autorikaitse objekt, mille kopeerimine ja levitamine on autori nõusolekuta keelatud! (0.0780)