Atlikėjas T. Narkevičius-Free Finga: dirbtinis intelektas neatims kūrybiškumo iš žmonių

2023-02-24


Lapkritį internete startavusi tekstų kūrimo sistema „ChatGPT“ plačiai paskleidė žinią apie dirbtinio intelekto galimybes. Tekstus, vaizdus ir garsus kuriantys algoritmai šiandien tampa mūsų gyvenimo dalimi, kuri yra ne tik laisvalaikio pramoga, bet ir meno, verslo sritis. Pavyzdžiui, su dirbtinio intelekto pagalba sukurtas vaizdas neseniai buvo parduotas už 500 tūkst. dolerių.
 
Srityse, kuriose visais laikais buvo aukštinamas žmogaus kūrybiškumas, dirbtinio intelekto (toliau – DI) klausimai yra aktyviai aptariami. Ar DI galiausiai pats vienas kurs meną, net be žmogaus įsikišimo? Kaip atskirti žmogaus ir DI kūrinius? Ar vis dėlto galime pasikinkyti algoritmus vystyti mūsų pačių kūrybiškumą? Apie tai – interviu su atlikėju ir kompozitoriumi, muzikos technologijų entuziastu Tomu Narkevičiumi-Free Finga, tapusiu didžiausios nuotolinės pamokos „Mokonomika“ pranešėju.
 

Free Finga


Tomai, kaip dėl DI pasikeis menininkų veikla? Ar ateityje išvis išliks menininko profesija, ar bus tiesiog „DI dailininkas“, „DI muzikantas“ ir panašiai?

Manau, kūrėjai ir menininkai kol kas gali likti ramūs. DI mene yra ir bus stiprus įrankis, galintis net pakeisti kai kuriuos amatus, pavyzdžiui, turinio bibliotekų kūrimą. Vis dėlto, nematau pasaulio, kuriame meną kuria tik algoritmai.
 
Tiek daug kūrybos yra emocijos, patirtys ir labai konkretūs žmonių sąlyčio taškai. Labiausiai paveikūs menininkai mumyse sugeba savo patirtimis sužadinti išgyvenimus ir audras, kurios nėra pamatuojamos. Menininkų biografijų detalės, praeitis ir kontekstas suteikia kūriniams dar vieną sluoksnį, kurio DI negali turėti. Muzika be kūrybiškumo ir inovatyvumo lieka tik amatas, paprasčiausia garsų kompozicija. Tikiu, kad atsiras naujos profesijos DI meno kuravimui ir kūrybai. Tačiau dažniausiai algoritmus matysime tik kaip bendraautorius ir partnerius.

Ar dabar egzistuoja priemonės ir būdai, kaip atskirti DI ir žmogaus sukurtus muzikos kūrinius?

Šiuo metu tai galima atskirti iš prastesnės garso kokybės, pašalinių triukšmų (angl. sonic artefacts) tempo nestabilumo. Kol kas DI sugeneruotas garsas dažniausiai tampa muzikos kompozicijų dalimis, jų elementais, kurias žmogus panaudoja galutiniam kūriniui. Ateityje DI kuriama muzika galėtų turėti garsažymes, kaip jas turi muzikos prodiuseriai dainų pradžioje – pagal tai ir būtų galima atskirti kūrinių autorystę.

Vis dėlto, jau dabar akivaizdu, kad klausysime ir vien tik DI sukurtų muzikos kūrinių. Ar ateityje muzikos topai, pavyzdžiui, radijo stotyse ir „Spotify“, bus bendri?

Skirtingi topai žmonių ir DI muzikai skamba kaip įdomi idėja, bet nemanau, kad ji būtų kažkas daugiau nei smalsumo patenkinimas. Tai vis tiek bus žmonių kuriama muzika. Įsivaizduoju pasaulį, kuriame atsiranda nauji, negirdėti žanrai, nes talentingi DI kuratoriai inovatyviai išnaudojo technologiją. Tikėtini net nauji instrumentai ir garso generavimo būdai.

Tavo manymu, ar DI yra žmogaus kūrybiškumo priešas, ar draugas?

Kūrybiškumas yra įgimta savybė, gyvenanti mumyse nuo žmonijos lopšio. Evoliucija yra kūrybiškumas. Visose srityse dirbantys žmonės turi atlikti daug kūrybiškų sprendimų. Perkėlus kai kuriuos amatus kompiuteriui, kūrybiškumas niekur nedings, mes visada rasim būdų, kur jį panaudoti.

O kaip galima būtų panaudoti DI kūrybingumui skatinti?

Vienas įdomiausių mano praktikuojamų būdų kūrybiškumui su DI praktikuoti yra kurti daiktus, kurie neegzistuoja. Pavyzdžiui, sukurti užklausą iš spalvoto stiklo pagamintam fortepijonui, po to keisti medžiagas ir formas, kol rezultatas atrodo neįtikimas, bet galintis egzistuoti realybėje. Tikiu, kad daugiau žmonių atrakins savo kūrybinį potencialą su DI technologijų pagalba.

Kokius pastaruosius, garsiai nuskambėjusius DI sukurto meno pavyzdžius galėtum įvardinti?

Pastaruoju metu algoritmų pagalba sukurti kūriniai jau pradėjo daryti tikrą įtaką esamai meno industrijai. Menininkų kolektyvo „Obvious“ ir DI pagalba kurtas kūrinys „Christie’s“ aukcione parduotas už beveik pusę milijono dolerių. Kitas su DI kurtas darbas Kolorado valstijos meno mugėje laimėjo pirmą vietą skaitmeniniu būdu sukurto meno nominacijoje.

Šie ir kiti pavyzdžiai kelia aktualius klausimus. Ar menininkas gali naudotis DI pagalba, dalyvaudamas konkursuose? Ar taip sukurtas kūrinys yra meno darbas, ar tik matematika?

Internete yra nemažai DI sistemų, turinčių sąsajų su muzika. Kuo jos skiriasi viena nuo kitos?
Internete jau yra keletas garsą generuojančių algoritmų, didžioji dalis jų veikia atviro kodo „Stable Diffusion“ sistemoje. Vieni jų skirti kurti garso efektus, t.y. objektų ir daiktų skambesį įvairiose erdvėse. Tokia sistema gali padėti sukurti specifinius garsus reklamai ar filmui, užuot juos suradus specialiose garsų bibliotekose.

Kiti algoritmai, pažindinami su įvairia muzika ar instrumentais, geba atkurti kartais chaotiškas, o kartais labai įdomias kompozicijas. Kadangi sistema atviro kodo, galima DI apmokyti savo sukurtais modeliais. Pavyzdžiui, kurti pagal tūkstančius lietuviškų sutartinių pavyzdžių.

Vienas įdomesnių garso generavimo pavyzdžių yra balso klonavimas. Supažindinus algoritmą su 15-a minučių žmogaus balso, sukuriama įtikinama jo kopija. Naujasis balso klonas puikiai įskaito suvestą tekstą. Girdėjau juokingų, bet kartu ir neraminančių klonuotų įžymybių balsų pavyzdžių.

Ar, suformavus tokias pačias užduotis skirtingoms DI sistemoms, gaunami ir skirtingi rezultatai?

Žmogus su generatyviu DI bendrauja užklausų (angl. prompts) pagalba, t.y. kuo aiškiau suformuluotomis žymėmis, kurios kuo tiksliau apibūdina norimą rezultatą. Jas algoritmai supranta pagal milžiniškus kiekius pažymėto turinio internete.
 
Eksperimentavau su vaizdo DI, ir, išties, suvedus tą pačią užklausą vaizdų generavimo sistemoms DALL-E ir „Midjourney“, rezultatai skiriasi. „Midjourney“ kuria itin panašiai atrodančius, tvarkingus, kokybiškus vaizdus, tačiau su juo gaunu mažiau įdomių, tolyn nuvedančių pavyzdžių. Tą pačią įvestį DALL-E apdoroja netvarkingiau, bet gaunu išsiskiriančius, įdomesnius rezultatus. Matosi, kad šių DI algoritmo treniravimo medžiaga skiriasi. DALL-E ir „Stable Diffusion“ algoritmai geriau veikia įvedant ne rišlias užklausas, pvz. „a bulldog, wearing a bowtie“, bet žymių sekas kaip „bulldog, red bowtie, realistic, photo“.

Apie dirbtinio intelekto galimybes pakeisti menininkus Tomas Narkevičius-Free Finga papasakos didžiausioje nuotolinėje pamokoje Lietuvoje „Mokonomika“, kuri įvyks kovo 9 d. Nemokamoje žinių šventėje moksleiviams ir mokytojams, skirtingam amžiui pritaikytas pamokas ves inovacijų, tvarumo, finansų bei kt. sričių ekspertai.

Daugiau informacijos apie didžiausią nuotolinę pamoką ir registracija – čia.

„Mokonomika“, inicijuojama „Swedbank“ ir transliuojama per LRT, prisideda prie UNICEF ir UNESCO rengiamos „Didžiausios pamokos pasaulyje“, kurios tikslas – kurti inovatyvias švietimo priemones, įgyvendinant Jungtinių Tautų darnaus vystymosi tikslus.

Siekdami užtikrinti geriausią Jūsų naršymo patirtį, šioje svetainėje naudojame slapukus (angl. cookies). Paspaudę mygtuką „Sutinku“ arba naršydami toliau patvirtinsite savo sutikimą. Bet kada galėsite atšaukti savo sutikimą pakeisdami interneto naršyklės nustatymus ir ištrindami įrašytus slapukus. Susipažinkite su slapukų politika.