umjetna inteligencija
Izvor: Gerd Altmann/Pixabay
PoslovniFM
UMJETNA INTELIGENCIJA

Čiji je sadržaj koji generiraju ChatGPT, DALL·E 2 i drugi AI sustavi?

Pred nama su uzbudljive godine, a pravnici ih nipošto ne bi smjeli prespavati. To je možda najkraći odgovor na pitanje iz naslova, pogled u budućnost i odnose umjetne inteligencije i prava intelektualnog vlasništva. O tome je za PoslovniFM pisao Marko Đurić, odvjetnik u Odvjetničkom društvu Porobija&Špoljarić.

Nešto više od godinu dana je prošlo otkad je OpenAI najavio DALL·E 2 i zatim ga učinio dostupnim javnosti, a nepunih osam mjeseci nakon toga stvorili su pravu malu revoluciju izbacivanjem jezičnog modela ChatGPT.

Riječ je o modelima sposobnima generirati tekst i slike koje nalikuju onome što bi čovjek izradio, a što je mnoge potaknulo na nagađanja o njihovom potencijalnom utjecaju na razne industrije, uključujući i pravo, jednako tako i pravo intelektualnog vlasništva.

Što su to zapravo ChatGPT i DALL·E 2 i kako funkcioniraju?

ChatGPT (Generative Pre-trained Transformer) je jezični model koji je razvio OpenAI, a koji na temelju danog inputa može generirati sadržaj, odnosno tekst koji nalikuje onome kakvog bi izradio čovjek. Koristi tehnike dubokog učenja (tzv. deep learning), na velikoj količini podataka i generira odgovore koji su koherentni i kontekstualno relevantni.

Riječ je auto generativnom chatu koji crpi informacije iz ogromne baze podataka, skuplja ih i zatim obrađuje pomoću tzv. natural language processinga, ne bi li ga učinio što razumljivijim ljudima i ljudskom jeziku. Specifičnim ga čini sposobnost učenja na temelju ulaznih podataka koje dobiva od korisnika, a što sustavu omogućuje stalno poboljšavanje.

Slično tome, DALL-E 2 je napredni AI sustav koji generira slike iz tekstualnih naredbi koristeći kombinaciju tehnika dubokog učenja. I taj sustav koristi ogromnu količinu podataka za treniranje, što uključuje slike i njihove opise. Sposoban je stvoriti složene slike s mnogo detalja, uključujući i objekte, odnosno prikaze koji ne postoje u stvarnom svijetu.

Kratica 'DALL-E' poigrava se s imenom poznatog umjetnika Salvadora Dalíja i kombinira ga s glavnim likom animiranog filma 'WALL-E'.

U oba slučaja, sustavi su osmišljeni da obavljaju zadatke koji bi inače zahtijevali ljudski intelekt, kreativnost i ono što smatramo originalnošću.

Zato je bitno postaviti pitanje što je s autorima, nositeljima prava na sadržaju na temelju kojeg AI sustavi treniraju, te može li ovdje doći do svojevrsne 'smrti autora' o kojoj je pisao Roland Barthes.

Tko su nositelji prava na sadržaju koji se generira?

Kako ove tehnologije nastavljaju napredovati i njihovi outputi koje generiraju postaju sve realističniji i sofisticiraniji, bitno je znati tko je nositelj prava na generirani sadržaj i kako postojeći pravni okviri i propisi mogu adekvatno adresirati sve nove izazove te kakve će biti implikacije svega toga na pravo.

Čeka nas - to je sigurno - niz novih pravnih i etičkih pitanja koje treba riješiti, a ovdje ćemo se pozabaviti pitanjem tko je nositelj prava na sadržaju koji generiraju AI sustavi, odnosno konkretno sustavi koje je razvio OpenAI.

Prije odgovora, valja ukratko izložiti osnove uređenja zaštite autorskog i srodnih prava u Europskoj uniji i Republici Hrvatskoj, odnosno osnovnih pojmova koji su nam ovdje bitni.

Što je to autorsko pravo, a što su to srodna prava?

Ne ulazeći posebno u naznaku odredaba Zakona o autorskom pravu i srodnim pravima (ZAPSP), važno je razumjeti osnove uređenja autorskog prava i srodnih prava kako bismo uopće mogli razmatrati glavnu temu članka.

Pojednostavljeno rečeno, autorsko pravo je pravo autora u pogledu njegovog autorskog djela te štiti interese stvaratelja, dok srodna prava štite osobe koje ulažu trud te materijalna i druga sredstva u radnje koje su u određenoj mjeri povezane s autorskim stvaralaštvom.

Što je to autorsko djelo?

Zakon o autorskom pravu i srodnim pravima definira autorsko djelo kao originalnu intelektualnu tvorevinu iz književnog, znanstvenog ili umjetničkog područja koja ima individualni karakter, bez obzira na način i oblik izražavanja, vrstu, vrijednost ili namjenu, ako tim zakonom nije drukčije određeno.

Kome pripada autorsko pravo?

Autorsko pravo pripada, po svojoj naravi, fizičkoj osobi koja stvori autorsko djelo, dok se autorsko pravo i srodna prava mogu protiv volje njihovih nositelja ograničiti samo pod pretpostavkama i na način određen Zakonom o autorskom pravu i srodnim pravima.

Što kaže ChatGPT?

Kako bi se dao odgovor na pitanje tko je nositelj prava na generiranom sadržaju te kako se taj sadržaj može koristiti, potrebno je pročitati Open AI uvjete korištenja (Terms of Use), ali prije toga sam odlučio postaviti taj upit ChatGPT-u. Ovo je odgovor koji sam dobio:

'Budući da sam virtualni jezični model, sadržaj koji generiram na temelju upita korisnika ne pripada meni, već osobi koja je naredbu dala. To znači da korisnik zadržava autorska prava na sadržaj koji sam generirao u skladu s njihovim upitom.

Važno je napomenuti da se to može razlikovati od autorskih prava na izvorne podatke koji su korišteni za moje treniranje, što je obično određeno odgovarajućim licencama ili pravilima korištenja tih podataka. Međutim, za generirani sadržaj, autorska prava pripadaju osobi koja je dala naredbu za generiranje tog sadržaja.

Također, važno je imati na umu da se bilo koji generirani sadržaj ne smije koristiti na način koji krši autorska prava ili druge zakone o zaštiti intelektualnog vlasništva.'

ChatGPT, naravno, kao AI sustav ne može biti nositelj autorskih prava na generiranom sadržaju, ali treba imati na umu da on sadržaj generira na temelju baze podataka na kojoj je treniran, stvarajući novi, dosad nepostojeći sadržaj. Taj sadržaj može biti zaštićen autorskim pravom, ali to ovisi o tome može li se uopće smatrati djelom, odnosno originalnom intelektualnom tvorevinom, pri čemu valja napomenuti i da se proizvođačima neoriginalnih baza podataka pruža zakonska zaštita, odnosno već prethodno spomenuta srodna prava.

Također, možemo li uopće znati kršimo li autorska prava na izvorna djela (podatke) koja su korištena za treniranje sustava? To dakako korisnik ne može nikako (ili teško) znati jer mu zasad nisu poznati izvori na temelju kojih je sadržaj generiran.

Može li onda, primjerice, pjesnik zadati naredbu sustavu da generira pjesmu pa ju javno objaviti kao svoju, i uz to još u komercijalne svrhe?

Mogući problemi pri korištenju generiranog sadržaja u javne, komercijalne svrhe

Kao što je već objašnjeno, sadržaj koji se generira nema svoj izvor isključivo u danoj naredbi korisnika, već u ogromnoj bazi podataka na temelju koje je AI sustav treniran, što uključuje i input milijuna drugih korisnika pa situacija postaje krajnje zamršena kada razmišljamo o potencijalnim implikacijama na ponovnu upotrebu generiranog sadržaja te općenito zaštiti autorskih prava.

Lako je moguće zamisliti situaciju u kojoj korisnik objavi generirani sadržaj kojim krši autorska prava drugog korisnika jer suviše nalikuje njegovom outputu ili pak stoga što suviše nalikuje već nekom drugom postojećem djelu. Što ako je prilikom davanja inputa korisnik bio inspiriran nekom postojećom pjesmom, pričom, fotografijom ili slikom pa AI sustav generira rezultat koji je iznimno sličan originalu koji je poslužio za davanje inputa?

Već sad brojni umjetnici, odnosno autori izražavaju svoju zabrinutost, a početkom godine je Getty Images najavio tužbu protiv društva Stability Diffusion AI koja stoji iza još jednog text-to-image modela dubokog učenja i to zato što se navodno poslužilo s više od 12 milijuna njihovih fotografija za treniranje svojeg sustava. Microsoft, GitHub, OpenAI i drugi su već također mete sličnih optužbi.

Mogu li se i kako autori zaštititi?

Direktiva (EU) 2019/790 Europskog parlamenta i vijeća od 17. travnja 2019. u članku 4. propisuje iznimke, odnosno ograničenja za potrebe tzv. rudarenja za potrebe rudarenja teksta i podataka pa tako stavak 3. propisuje sljedeće:

'Iznimka ili ograničenje predviđeni u stavku 1. primjenjuju se pod uvjetom da korištenje djela i drugih predmeta zaštite iz tog stavka nisu izričito pridržali njihovi nositelji prava na primjeren način, kao što je alat za strojno čitanje u slučaju sadržaja koji je stavljen na raspolaganje javnosti na internetu.'

Drugim riječima, tzv. rudarenje teksta i podataka, odnosno tzv. TDM (text data mining) proces kojim se koriste sustavi umjetne inteligencije za 'skidanje' sadržaja s interneta je načelno dopušteno i ne predstavlja kršenje autorskih prava, pod uvjetom da se to radi u postojećem pravnom okviru, pri čemu nositelji autorskih prava imaju tzv. opt-out opciju, odnosno pravo zabraniti korištenje njihovih djela za taj proces.

Upitno je, međutim, kako je tako nešto uopće moguće nadzirati te kako će se to pitanje u budućnosti regulirati.

Pravne implikacije naglog razvoja AI-a

Razvoj AI sustava poput ChatGPT-a imat će značajne pravne posljedice na području odgovornosti za štetu, zaštite privatnosti, zaštite osobnih podataka, radnog prava te brojnih drugih grana prava.

Osim toga, razvoj takvih AI sustava imat će značajne posljedice na razvoj prava intelektualnog vlasništva, posebice u vezi s autorstvom AI-generiranih djela. Iako postojeći pravni okviri pružaju određene smjernice, pitanje reguliranja i zaštite takvih djela još uvijek ostaje neizvjesno. Trenutno se čini da korisnici koji koriste AI kao alat za pomoć u kreativnom procesu mogu biti nositelji prava nad rezultirajućim djelom, odnosno generiranim sadržajem ako ono odražava njihove izbore i kreativnost. Međutim, ako AI sustav generira djelo bez značajnog doprinosa korisnika, postojanje autorskog djela postaje upitno.

Budući da se AI tehnologija nastavlja razvijati i postaje sve integriranija u naše društvo, ključno je da zakonodavci i pravni stručnjaci ostanu u tijeku s ovim razvojem i prilagode pravni okvir u skladu s tim. Pronalaženjem ravnoteže između zaštite prava autora i poticanja inovacija u AI, možemo stvoriti pravno okruženje koje podržava odgovorni razvoj i korištenje ovih transformacijskih tehnologija. Stoga će u danima koji slijede biti važno pristupiti regulaciji AI-generiranih djela s ciljem balansiranja suprotstavljenih interesa i poticanja pravednije i inkluzivnije budućnosti.

Konačno, nije nauštrb napomenuti da je prethodna dva paragrafa sastavio ChatGPT na temelju moje naredbe koja je u sebi sadržavala neke od ključnih odrednica zaključka koji ste pročitali. O tome čiji je to zaključak dalo bi se raspravljati, ali jedno je sigurno – pred nama su uzbudljive godine, a pravnici ih nipošto ne bi smjeli prespavati.

Cijeli tekst možete pročitati na PoslovniFM-u.

Ako želite još zanimljivih poslovnih i životnih savjeta, prijavite se na naš dvomjesečni newsletter.