Zakonito rudarjenje besedil in podatkov v dobi umetne inteligence

Evropska unija se v svoji digitalni strategiji osredotoča na uravnotežen razvoj umetne inteligence (AI) ter zaščito pravic intelektualne lastnine. Pri tem se sooča z dvema ključnima izzivoma: izvajanjem določb o rudarjenju besedil in podatkov (TDM – Text and Data Mining) ter skladnostjo z Aktom o umetni inteligenci (AI Akt – Uredba (EU) 2024/1689 o določitvi harmoniziranih pravil o umetni inteligenci).

Namen zakonitega rudarjenja besedil in podatkov (TDM)

Rudarjenje besedil in podatkov (TDM) je avtomatiziran proces, ki omogoča računalniško analizo velikih količin podatkov za pridobivanje vzorcev, trendov in novih informacij. TDM se uporablja na številnih področjih, vključno z:

Raziskavami in znanostjo – omogoča hitrejše odkrivanje novih medicinskih terapij, analizo znanstvene literature in napovedovanje epidemioloških trendov.
Razvojem umetne inteligence – izboljšuje modele strojnega učenja, omogoča razumevanje naravnega jezika in generiranje besedil.
Novinarstvom in analizo podatkov – pomaga pri odkrivanju ponarejenih novic, analizi družbenih omrežij in raziskovanju gospodarskih trendov.
Industrijo in podjetništvom – podjetja uporabljajo TDM za analizo tržnih trendov, avtomatizirano obdelavo dokumentov in izboljšanje poslovnih strategij.

Zakonodaja EU priznava vrednost TDM in določa posebne izjeme za zakonito izvajanje tega procesa, hkrati pa ščiti pravice imetnikov avtorske pravice.

Rudarjenje besedil in podatkov in pravica do izjeme (opt-out)

Direktiva o avtorski in sorodnih pravicah na enotnem digitalnem trgu (DMS – Directive on Copyright in the Digital Single Market, 2019/790) uvaja pravila, ki omogočajo zakonito rudarjenje besedil in podatkov, vendar hkrati v nekaterih primerih dajejo imetnikom pravic možnost, da iz tega procesa izključijo svoje vsebine.

V Sloveniji je rudarjenje besedil in podatkov urejeno v Zakonu o avtorski in sorodnih pravicah (ZASP), in sicer v členih 57.a in 57.b.

57.a člen ZASP določa, da je za namene besedilnega in podatkovnega rudarjenja prosto reproduciranje del, do katerih se zakonito dostopa. Določene so obveznosti glede varnostnih ukrepov, ki ne smejo neupravičeno omejevati izvajanja rudarjenja ter opt-out pravica avtorjev, ki si lahko izrecno pridržijo pravico uporabe avtorskih del.
57.b člen ZASP uvaja posebno izjemo za besedilno in podatkovno rudarjenje v znanstvene raziskovalne namene, pri čemer določa pogoje za raziskovalne organizacije ter obveznost hrambe podatkov v varnem okolju.

S tem slovenska zakonodaja prenaša določbe Direktive (EU) 2019/790 o avtorski in sorodnih pravicah na enotnem digitalnem trgu (DMS Direktiva) in določa pogoje, pod katerimi lahko uporabniki izvajajo besedilno in podatkovno rudarjenje, hkrati pa ščiti pravice imetnikov avtorskih del.

Težava, ki se pri tem pojavlja, je predvsem praktične narave – kako zagotoviti učinkovit, pregleden in enoten sistem, ki bi omogočal izvajanje teh izjem na način, ki ne bi zaviral razvoja umetne inteligence in podatkovnih analiz, hkrati pa bi nudil tudi zadosten nivo pravne varnosti. Trenutno ni enotne rešitve za upravljanje teh izjem, kar ustvarja pravno in tehnično negotovost za raziskovalce in razvijalce AI.

Obveznosti glede avtorske pravice v AI Aktu

AI Akt, ki določa regulativni okvir za razvoj in uporabo umetne inteligence v EU, uvaja stroge zahteve glede preglednosti podatkovnih virov, ki jih uporabljajo AI modeli. Ključni člen, ki ureja avtorsko pravico in TDM je člen 53 AI Akta, ki:

določa, da morajo ponudniki sistemov umetne inteligence, ki temeljijo na podatkovnem rudarjenju, objaviti dovolj podroben povzetek uporabljenih podatkovnih virov. To pomeni, da morajo podjetja razkriti, katere vsebine so uporabile za treniranje svojih modelov, kar ima neposredne posledice za avtorske pravice in skladnost s TDM izjemami;
uvaja zahteve za ponudnike modelov AI za splošne namene (kot so veliki jezikovni modeli), da zagotovijo skladnost z avtorskimi pravicami in jasno navedejo, če njihovi modeli uporabljajo avtorsko zaščitene podatke.

Te določbe pomenijo, da morajo ponudniki in razvijalci umetne inteligence ne le spremljati morebitne opt-out izjeme iz DMS Direktive, temveč tudi zagotavljati transparentnost glede uporabe podatkov, kar povečuje kompleksnost skladnosti.

Evropska komisija išče rešitve

Z namenom boljšega razumevanja in reševanja teh vprašanj je Evropska komisija objavila razpis za študijo izvedljivosti centralnega registra izjem za TDM. Cilj te pobude je raziskati, kako bi lahko vzpostavili enoten, centraliziran sistem, ki bi omogočal učinkovito upravljanje izjem, ne da bi s tem zavirali inovacije in raziskave na področju umetne inteligence.

S to študijo želi EU pridobiti vpogled v tehnične in pravne vidike upravljanja izjem, oceniti možnosti za standardizacijo procesov ter preučiti, kako bi se lahko zagotovila skladnost z obstoječimi in prihodnjimi zakonodajnimi zahtevami, kot jih določata DMS Direktiva in AI Akt.

Razpis jasno kaže zavezanost Evropske unije iskanju inovativnih rešitev, ki bodo omogočale nadaljnji razvoj digitalnih tehnologij, hkrati pa varovale interese imetnikov pravic in spodbujale preglednost uporabe podatkov v umetni inteligenci.

*Ta članek je bil generiran s pomočjo umetne inteligence ChatGPT, ki ga je razvilo podjetje OpenAI.

Vir: Dokumentacija Razpisa Evropske komisije št. EC-CNECT/2025/OP/0002 https://ec.europa.eu/info/funding-tenders/opportunities/portal/screen/opportunities/tender-details/8726813a-bd9b-4f58-8679-01c80f7a1abf-CN

Etični pregled za objavo članka, ki ga je ustvarila umetna inteligenca, na spletni strani

Kontrola kakovosti: Aljaž Jadek je z različnimi pozivi usmerjal ChatGPT pri pisanju tega članka. Aljaž Jadek je članek pregledal, popravili in dopolnil in potrjuje, da je kakovost članka zadostna za objavo in da v njem ni napak (tj. halucinacij AI).

Izogib plagiatorstvu: Članek je z vidika plagiatorstva pregledal in preveril Aljaž Jadek, ki potrjuje, da članek ne predstavlja plagiatorstva.

Ohranjanje kreativnosti: Po mnenju Aljaža je vsebina edinstvena, informativna in zanimiva ter zato primerna za objavo.

Etični razmislek: Po mnenju Aljaža vsebina ni zavajajoča ali kako drugače etično problematična in je zato primerna za objavo.

Označitev vsebine AI: Transparentno je razkrito, da je članek ustvaril sistem umetne inteligence – ChatGPT.

Najboljše prakse SEO: Članek ni bil ustvarjen in objavljen za manipulacijo z iskalnimi uvrstitvami, ampak je informativne narave in opisuje zanimiv preseka dveh pravnih ureditev – varstva avtorskih pravic in umetne inteligence.

Zakonito rudarjenje besedil in podatkov v dobi umetne inteligence

Namen zakonitega rudarjenja besedil in podatkov (TDM)

Rudarjenje besedil in podatkov in pravica do izjeme (opt-out)

Obveznosti glede avtorske pravice v AI Aktu

Evropska komisija išče rešitve

Avtorji članka

Sorodne objave

Avtorska pravica in varstvo osebnih podatkov pri uporabi umetne inteligence

Nove meje avtorskega prava v dobi generativne umetne inteligence

Pripravili smo nov vodič za Patent Litigation