Legezko Doomsday For Generative AI ChatGPT Plagiatzen edo hausten badute, ohartarazten du AI Etika eta AI Legea

ChatGPT bezalako AI sortzaileak gure webguneak eta gizakiak asmatutako edukiak erauzi al ditu? Kontuan izan, izan … [+] asaldatu, prest egon.

Getty

Eman kreditua zor den tokian.

Hori beharbada irmo sinesteko hazi zinen jakinduria jakintsu bat da. Izan ere, batek suposatzen du edo imajinatzen du denok nahiko ados egon gaitezkeela bizitzako arau zuzen eta zentzuzko bat dela. Norbaitek aitorpena merezi duen zerbait egiten duenean, ziurtatu merezi duen aitorpena lortzen duela.

Ikuspegi kontrakoa askoz gutxiago sinesgarria dirudi.

Norbaitek kreditu hori tematuz ibiliko balitz ez kreditua behar denean aitortua izan behar da, tira, sinesmen hori adeigabea dela eta, seguru asko, gaiztoa dela esan dezakezu. Askotan ozenki asaldatuta aurkitzen gara zerbait aipagarria egin duen norbaiti kreditua engainatzen zaionean. Ausartzen naiz esatera, batez ere alde egiten dugula besteek besteen lana faltsuki hartzen dutenean. Hori bikoizte kezkagarria da. Kreditua lortu behar zuen pertsonari eguzkitan dagoen unea ukatzen zaio. Horrez gain, iruzurgilea fokua gozatzen ari da, nahiz eta gaizki engainatzen gaituzten gure aldeko afektuak desbideratuz.

Zergatik modu egokian lortu eta bide oker eta mespretxagarriak saihesteko kreditu hori guztia?

Badirudi antzeko egoera baten aurrean gaudela Adimen Artifizialaren (AI) azkenengoari dagokionez.

Bai, esaten da hori modu frogagarrian gertatzen ari dela izenez ezagutzen den AI mota baten bidez AI sortzailea. Eskuz idazten ari da Generative AI, egun albisteetako AIrik beroenak, dagoeneko meriturik merezi ez duenaren meritua hartu duela. Eta litekeena da hori okerrera egingo du sormenezko IA gero eta gehiago zabaldu eta erabiltzen den heinean. Gero eta kreditu gehiago sortzen da AI sortzaileari, eta zoritxarrez benetako kreditua merezi duten horiek hautsean geratzen dira.

Ustezko fenomeno hau argi eta garbi adierazteko proposatzen dudan modua bi esaldi bitxiak dira:

1) Plagioa eskalan
2) Copyright-haustea eskala mailan

Uste dut OpenAI-k azaroan kaleratu zuen ChatGPT izenez ezagutzen den AI sortzailearen berri izan dezakezula. AI sortzaileari eta ChatGPTri buruz gehiago esango dut une batez. Eskegi hor.

Goazen berehala jendearen ahuntzak lortzen ari denaren muinera, esate baterako.

Batzuk sutsuki kexatzen ari dira AI sortzaileak edukia sortu duten gizakiak erauzi ditzakeela. Ikusten duzu, sorkuntzako AI aplikazio gehienak Interneten aurkitutako datuak aztertuz trebatutako datuak dira. Datu horietan oinarrituta, algoritmoek AI aplikazioaren barne-ereduen bat-etortze-sare zabala hobetu dezakete, gerora itxuraz itxurazko eduki berria ekoitzi ahal izango duena, eta itxura harrigarrian gizakiaren eskuz sortua balitz bezala, automatizazio zati bat baino gehiago.

Balentria nabarmen hau Interneten eskaneatutako edukiez baliatzeari zor zaio neurri handi batean. Interneteko edukien bolumena eta aberastasuna datuen prestakuntzarako iturri gisa, AI sortzailea ia hutsik egongo litzateke eta erabiltzeko interes gutxi edo bat ere izango luke. AI-k milioika milioi dokumentu eta testu sarean aztertuta, erlazionatutako eduki mota guztiekin batera, ereduen bat-etortzea lortzen da pixkanaka gizakiak sortutako edukia imitatzen saiatzeko.

Zenbat eta eduki gehiago aztertu, litekeena da ereduen parekatzea askoz hobetzea eta mimetismoan hobetzea, gainerako guztiak berdinak izanik.

Hona hemen zilioi dolarreko galdera:

Galdera handia: Zuk edo besteek Interneten badaukazu AI sorkuntzako aplikazioren bat trebatu den edukia, ziurrenik zure baimen zuzenik gabe eta beharbada guztiz zure kontzientziarik gabe eginez gero, tarta zatiren bat jasotzeko eskubidea izan beharko zenuke edozein balioren arabera. AI datuen prestakuntza sortzaile hori?

Batzuek gogor esaten dute erantzun egoki bakarra dela Bai, batez ere, giza edukien sortzaile horiek ekintzaren mozketa merezi dutela. Kontua da, zaila izango zinateke bere zati justua lortu duen inor aurkitzea, eta okerrago, ia inork ez du parterik lortu. Nahi gabe eta jakin gabe ekarpena egin duten Interneteko eduki-sortzaileei funtsean dagokien kreditua ukatzen zaie.

Hau ikaragarri eta ikaragarritzat jo daiteke. Kreditua behar den tokian kreditua eman behar zaion jakinduria jakintsuaren desegitea besterik ez dugu egin. AI sortzailearen kasuan, itxuraz, ez. Kredituari buruzko aspaldiko eta bertutetsua den arau arrunta bortizki urratzen dela dirudi.

Aupa, dio erreplikak, egoera guztiz gainditzen eta gaizki adierazten ari zara. Noski, AI sortzaileak Interneteko edukia aztertu zuen. Noski, hau oso lagungarria izan zen AI sortzailearen datuen prestakuntzaren zati gisa. Egia da, gaur egungo AI sormenezko aplikazio ikusgarriak ez lirateke hain ikusgarriak izango ikuspegi hau gabe. Baina zubi bat urrunago joan zara esanez edukien sortzaileei kreditu itxura jakin bat eman behar zaiela.

Logika hau da. Gizakiak Internetera joaten dira eta Internetetik gauzak ikasten dituzte, modu arruntean eta berez inolako zalapartarik gabe. Iturgintzari buruzko blogak irakurtzen dituen eta, ondoren, doan eskura daitezkeen iturgintza konpontzeko bideoak ikusten dituenak hurrengo egunean kalera atera eta iturgin gisa lan egin dezake. Iturgintzarekin lotutako diru-ordainketen zati bat eman behar al diote konketa nola iturtzen idatzi duen blogari? Kuota bat eman behar al diote isuritako bainuontzi bat konpontzeko urratsak erakusten dituen bideoa egin duen vlogger-ari?

Ia ziur ez.

AI sortzailearen datuen prestakuntza ereduak garatzeko bitarteko bat besterik ez da. AI sortzailearen irteerak aztertutakoaren erregurditze hutsa ez diren bitartean, "ikasi" dutela eta, beraz, iturri zehatz bati inolako kreditu zehatzik emateko gai ez direla argudiatu ahal izango duzu. Erregurgitazio zehatz bat egitean AI sortzailea harrapatzen ez baduzu, AI iturri jakinetatik haratago orokortu dela adierazten dute.

Ez zaio inori zor krediturik. Edo, batek suposatzen du, esan liteke meritua guztiontzat dela. Interneten aurkitzen den gizateriaren testu kolektiboak eta beste eduki batzuek lortzen dute meritua. Denok lortzen dugu kreditua. Iturri jakin bati kreditua zehazten saiatzea zentzugabea da. Poztu zaitez AI aurreratzen ari dela eta gizateriari onura aterako zaiolako. Interneten egindako argitalpen horiek ohore egin beharko lukete AIren aurrerapenen etorkizunean lagundu dutelako eta horrek gizadiari betierekotasunerako nola lagunduko dion.

Gehiago esango dut bi ikuspegi kontrajarri horiei buruz.

Bien bitartean, Interneten webguneak dituztenentzat kredituak eta berandu atzeratuta daudela dioen kanpamendura makurtzen al zara, edo Interneteko edukien sortzaileak erabakita daudela dioen alde kontrakoa iruditzen zaizu. ez erauzi egitea jarrera sendoagoa al da?

Enigma bat eta asmakizun bat denak bat eginda.

Deskonprimitu dezagun hau.

Gaurko zutabean, AI sortzaileak funtsean Interneten argitaratutako edukien egile-eskubideak (Jabetza Intelektualaren eskubide edo IP arazotzat hartzen dena) plagiatzen edo agian urratzen dituelako adierazitako kezka horiei helduko diet. Zalantza hauen oinarria aztertuko dugu. Eztabaida honetan ChatGPT-ra aipatuko dut noizean behin, AI sortzailearen 600 kiloko gorila delako, nahiz eta kontuan izan beste AI generatiboko aplikazio ugari daudela eta orokorrean printzipio orokor berdinetan oinarritzen direla.

Bitartean, baliteke AI sortzailea zer den galdetzen ari zarena.

Azter ditzagun lehenik AI sorkuntzaren oinarriak eta gero gertutik begiratu diezaiokegu eskuartean dugun gaiari.

Honetan guztian AI Etika eta AI Legearen gogoeta ugari sartzen dira.

Kontuan izan etengabeko ahaleginak egiten ari direla AI Etikoen printzipioak AI aplikazioen garapenean eta eremuan sartzeko. AI arduratsu eta antzinako etikaren kontingente gero eta handiagoa da IA diseinatu eta hartzeko ahaleginak egiteko ikuspegia kontuan hartzen duela ziurtatzen saiatzen ari da. AI For Good eta saihestea AI For Bad. Era berean, AIren inguruko lege berriak proposatzen dira, AIren ahaleginak giza eskubideen eta antzekoen aurka ibil ez daitezen konponbide potentzial gisa. AI Etika eta AI Legearen etengabeko estaldura zabala ikusteko, ikus esteka hemen esteka hemen, Gutxi batzuk aipatzearren.

AI etikoen manuen garapena eta zabalkundea egiten ari dira, zorionez, gizartea AI eragiten duten tranpa ugaritan eror ez dadin. Ia 200 herrialdek UNESCOren ahaleginen bidez diseinatutako eta babesten duten NBEren AIaren etika printzipioen inguruan, ikus esteka hemen. Ildo beretik, AI lege berriak aztertzen ari dira AI maila berdinean mantentzen saiatzeko. Azken hartzeetako bat proposatutako multzo batek osatzen du AI Eskubideen Agiria AEBetako Etxe Zuriak AIren garaian giza eskubideak identifikatzeko kaleratu berri duena, ikus esteka hemen. Herrixka bat behar da AI eta AI garatzaileak bide egokian mantentzeko eta gizartea honda dezaketen nahita edo ustekabeko esfortzu maltzurrak eragozteko.

Eztabaida honetan AI Etika eta AI Zuzenbideari lotutako gogoetak uztartuko ditut.

AI sortzailearen oinarriak

AI sortzailearen instantziarik ezagunena ChatGPT izeneko AI aplikazio batek adierazten du. ChatGPT azaroan sortu zen kontzientzia publikoan OpenAI AI ikerketa enpresak kaleratu zuenean. ChatGPT-k goiburu handiak lortu dituenetik eta harrigarriki gainditu zituen hamabost minutuko ospea.

Uste dut ChatGPTren berri izan duzula edo erabili duen norbait ezagutzen duzula.

ChatGPT AI aplikazio sortzailetzat hartzen da, sarrera gisa erabiltzaile baten testu batzuk hartzen dituelako eta gero sortzen edo saiakeraz osatutako irteera bat sortzen du. AI testu-testu-sorgailu bat da, nahiz eta AI testu-to-saiak-sorgailu gisa deskribatzen dudan, horrek errazago argitzen baitu zertarako erabiltzen den. AI sortzailea erabil dezakezu konposizio luzeak osatzeko edo iruzkin labur samarrak eskaintzeko lor dezakezu. Dena zure eskaeran dago.

Egin behar duzun guztia gonbita bat sartzea da eta AI aplikazioak zure gonbita erantzuten saiatzen den idazlan bat sortuko dizu. Konposatutako testuak saiakera gizakiaren eskuak eta adimenak idatzi izana dirudi. "Esadazu Abraham Lincoln-i buruz" esaten zuen gonbita sartuko bazenu AI generatiboak Lincoln-i buruzko saiakera bat emango dizu. Badira AI sortzailearen beste modu batzuk, hala nola testutik artera eta testutik bideora. Testutik testuaren aldakuntzan zentratuko naiz hemen.

Zure lehenengo pentsamendua izan daiteke sormen-gaitasun horrek ez duela hain gauza handirik iruditzen saiakerak ekoizteari dagokionez. Interneten sarean bilaketa erraz bat egin dezakezu eta Lincoln presidenteari buruzko saiakera ugari aurki ditzakezu. AI sortzailearen kasuan, sortutako saiakera nahiko bakarra da eta kopia bat baino jatorrizko konposizioa eskaintzen du. AI-k sortutako saiakera sarean nonbait aurkitzen saiatuko bazenu, nekez aurkituko zenuke.

AI generatiboa aldez aurretik trebatuta dago eta sarean zehar idatzitako hitz eta istorioetako ereduak aztertuz ezarri den formulazio matematiko eta konputazional konplexu bat erabiltzen du. Milaka eta milioika pasarte idatzi aztertzearen ondorioz, AIak saiakera eta istorio berriak bota ditzake aurkitutakoaren nahasketa bat. Hainbat funtzionalitate probabilistiko gehituz, ondoriozko testua nahiko berezia da prestakuntza multzoan erabili denarekin alderatuta.

AI sortzailearen inguruko kezka ugari daude.

Alde negatibo bat da sorkuntzan oinarritutako AI aplikazio batek ekoitzitako saiakerek hainbat faltsukeria txertatu ditzaketela, ageriko egiazkoak diren gertaerak, engainagarriki erretratatzen diren gertaerak eta guztiz fabrikatutako itxurazko gertaerak barne. Fabrikatutako alderdi horiei forma gisa deitzen zaie sarritan AI haluzinazioak, gaitzetsi egiten dudan esaldi bat, baina deitoratuz, hala ere popularra hartzen ari dela dirudi (terminologia txarra eta desegokia zergatik den honi buruzko azalpen zehatza lortzeko, ikusi nire estaldura helbidean esteka hemen).

Beste kezka bat da gizakiek erraz har dezaketela AI bidez ekoitzitako saiakera sortzaile baten meritua, saiakera beraiek idatzi ez duten arren. Entzun zenuten irakasleak eta eskolak nahiko kezkatuta daudela AI sortzaileen aplikazioen sorrerarekin. Ikasleek sor dezaketen IA erabil dezakete esleitutako idazlanak idazteko. Ikasle batek idazlan bat bere eskuz idatzi dela esaten badu, aukera gutxi dago irakasleak AI sortzaileak sortu duen ala ez hautemateko. Ikasle eta irakasle nahaste-fazeta hau aztertzeko, ikusi nire estaldura helbidean esteka hemen esteka hemen.

Sare sozialetan izugarrizko erreklamazio batzuk izan dira AI sortzailea AIren azken bertsio hau hain zuzen ere dela baieztatuz sentikorra den AI (ez, oker daude!). AI Etika eta AI Zuzenbidean daudenak kezkatuta daude erreklamazio hedatuen joera hazten ari denarekin. Adeitasunez esango zenuke pertsona batzuk gaur egungo AI-ak benetan egin dezakeena gainditzen ari direla. Guk oraindik lortu ezin izan ditugun gaitasunak dituela suposatzen dute. Tamalgarria da hori. Are okerragoa dena, beraiek eta besteek egoera larrietan sartzea ahalbidetu dezakete, AI sentikorra edo gizakiaren antzekoa izango dela neurriak hartu ahal izateko.

Ez antropomorfizatu AI.

Hori eginez gero, AI-ak egin ezin dituen gauzak egingo dituela itxaroteko konfiantzazko tranpa itsatsi eta latz batean harrapatuko zaitu. Hori esanda, AI sortzailearen azkena nahiko ikusgarria da egin dezakeenagatik. Kontuan izan, ordea, AI sorkuntzako edozein aplikazio erabiltzean etengabe kontuan izan behar dituzun muga handiak daudela.

Oraingoz azken abisu bat.

Ikusten edo irakurtzen duzun guztia AI erantzun generatibo batean badirudi faktiko huts gisa helarazteko (datak, lekuak, pertsonak, etab.), ziurtatu eszeptiko mantentzen eta ikusten duzuna berriro egiaztatzeko prest egon.

Bai, datak asma daitezke, lekuak osa daitezke eta normalean gaitzetsi gabe egotea espero dugun elementuak dira. guztiak susmoen menpe. Ez sinetsi irakurtzen duzuna eta mantendu begi eszeptikoa AI sorkuntzako saiakera edo irteerak aztertzerakoan. AI-aplikazio sortzaile batek Abraham Lincolnek bere jet pribatuan herrialdean zehar hegan egin zuela esaten badizu, zalantzarik gabe jakingo zenuke hori malarkia dela. Zoritxarrez, pertsona batzuk agian ez dira konturatzen bere garaian hegazkinak ez zirela inguruan, edo baliteke saiakerak erreklamazio ausarta eta izugarri faltsu hau egiten duela jakin, baina ez dute ohartuko.

Eszeptizismo osasuntsuaren dosi sendoa eta sinesgaitzaren pentsamolde iraunkorra izango dira zure aktiborik onena AI sortzailea erabiltzean.

Prest gaude argibide honen hurrengo fasera pasatzeko.

Internet eta AI sortzailea elkarrekin daude honetan

Orain, AI sortzailea zer den itxura bat baduzu, AI sortzailea nahiko edo bidegabe "aprobetxatzen" ote den azter dezakegu, edo batzuek esango lukete. nabarmenki ustiatzeko Interneteko edukia.

Hona hemen gai honi dagozkion lau funtsezko gaiak:

1) Arazo bikoitza: plagioa eta copyright-urraketa
2) Plagioa edo egile eskubideen urraketa frogatzen saiatzea saiatuko da
3) Plagioaren edo copyright-haustearen kasua egitea
4) Legezko Minak Zain

Gai garrantzitsu horietako bakoitza landuko dut eta guztiok gogoan hartu beharko genituzkeen gogoeta sakonak eskainiko ditut. Gai hauetako bakoitza puzzle handiago baten parte da. Ezin diozu pieza bakarrari begiratu. Ezin duzu piezarik begiratu beste piezetatik isolatuta.

Mosaiko korapilatsua da eta puzzle osoa kontuan hartu behar da.

Arazo bikoitza: plagioa eta copyright-urraketa

AI sortzailea egiten eta lantzen dutenek duten arazo bikoitza hau da, beren produktuek bi gauza txar egiten ari direla:

1) Plagioa. AI sortzailea honela ulertu liteke plagiatuz Interneten dagoen edukia AIaren datuen prestakuntzan egin den Interneten eskaneamenduaren arabera.
2) Copyright-a urratzea. AI sortzailea enpresa gisa aldarrikatu liteke copyright-urratzea datuen prestakuntzan zehar eskaneatu den Interneteko edukiarekin lotutakoa.

Argitzeko, AI sortzailearen datuen prestakuntzarako normalean eskaneatzen dena baino eduki gehiago dago Interneten. Interneten zati txiki bat bakarrik erabiltzen da normalean. Beraz, uste dugu datuen prestakuntzan eskaneatu ez den edukiek ez dutela AI sortzailearekin behi berezirik.

Hori eztabaidagarria da, hala ere, eskaneatutako beste edukiarekin eskaneatu ez den edukiarekin lotzen duen lerro bat marraztu dezakezulako. Gainera, beste baldintza garrantzitsu bat da eskaneatu ez den edukia badago ere, plagioa dela eta/edo copyright-a urratu dela argudiatu daitekeela AI sortzailearen irteerak berba berean lurreratzen badira. Nire kontua da honetan guztian squishishness handia dagoela.

Beheko lerroa: AI generatiboak plagioari eta egile-eskubideen urraketari dagokionez, AI Etiko eta AI Legearen legezko arazoez beteta dago. indarrean dauden datuen prestakuntza-praktiken oinarrian.

Orain arte, AI-eko arduradunek eta AI-ko ikertzaileek ez dute ia eskoziarik gabe igaro, haien gainean zintzilik dagoen ezpata itxuragabe eta zintzilik dagoen arren. Jardunbide horien aurka epaiketa batzuk baino ez dira martxan jarri orain arte. Baliteke lege-ekintzei buruzko albisteak entzun edo ikusi izana. Bat, adibidez, Midjourney eta Stability AI-ren testu-irudiko enpresek Interneten argitaratutako eduki artistikoak urratzen dituzte. Beste batek GitHub, Microsoft eta OpenAIren aurkako testu-kodearen urraketa dakar Copilot softwareak AI aplikazioak ekoizten dituelako. Getty Images-ek Stability AIren atzetik joatea ere izan du helburu, testu-irudiaren urraketagatik.

Aurreikus dezakezu horrelako auzi gehiago aurkeztuko direla.

Oraintxe bertan, aukera pixka bat da auzi horiek abiaraztea, emaitza nahiko ezezaguna baita. Auzitegiak AI egileen alde egingo al du edo haien edukia bidegabe ustiatu zela uste dutenak izango dira garaileak? Borroka juridiko garestia beti da kontu serioa. Eskala handiko kostu legalak gastatzea irabazteko edo galtzeko aukerekin neurtu behar da.

Badirudi AI-ren arduradunek borroka egitea beste aukerarik ez dutela izango. Apur bat sartuko balira ere, aukerak dira auzi gehigarri ugari sortuko liratekeela (funtsean, beste batzuk ere gailentzeko aukera handiagoei atea irekitzea). Uretan legezko odola dagoenean, gainerako legezko marrazoak jotzen den "puntuazio erraza"ra joango dira eta diru-odol-odol bat gertatuko litzateke ziur aski.

Batzuen ustez, AIren sortzaileak babestuko lituzkeen AI lege berriak onartu beharko genituzke. Babesa atzeraeragina ere izan daiteke. Honen oinarria AI sorkuntzako aurrerapenak ikusi nahi baditugu, AI-ren arduradunei eremu seguruko pista bat eman behar diegu. Auziak AI sortzaileen aurka garaipenak lortzen hasten direnean, hori gertatzen bada (oraindik ez dakigu), kezka da AI sortzailea lurrunduko dela, inork ez baitu AI enpresei babesik emateko prest.

Ilia Kolochenko eta Gordon Platt doktoreak "ChatGPT: IP, Cybersecurity & Other Legal Risks of Generative AI" izeneko Bloomberg Law artikulu batean trebeki adierazi bezala, Bloomberg Law, 2023ko otsailean, hona hemen ikuspuntu hauen oihartzuna duten bi pasarte ezinbestekoak:

"Eztabaida sutsua da orain AEBetako lege-irakasleen eta IP zuzenbideko irakasleen artean, baimenik gabeko urraketak eta egile-eskubidedun datuen ondorengo erabilera egile eskubideen urraketa den ala ez. Praktika horretan egile eskubideen urraketak ikusten dituzten lege-profesionalen iritzia gailentzen bada, AI sistemen erabiltzaileek ere bigarren mailako urraketen erantzule izan daitezke eta balizko ondorio juridikoak izan ditzakete.
"Erronkari osoki aurre egiteko, legebiltzarkideek indarrean dagoen copyright-legeria modernizatzeaz gain, AI-rako berariazko lege eta araudi multzo bat ezartzea ere aztertu beharko lukete".

Gogoratu gizarte gisa babes juridikoak jarri genituela hedapen Interneten, orain Auzitegi Gorenak 230. Artikulu ospetsua edo gaiztoa berrikusten duen bezala. Beraz, badirudi arrazoiaren eta aurrekariaren barruan prest egon gaitezkeela AI sortzailearen aurrerapenerako antzeko babes batzuk egiteko. Agian babesak aldi baterako ezar daitezke, AI sortzaileak aurrez zehaztutako gaitasun-maila bat lortu ondoren iraungiko dira. Beste babes-xedapen batzuk sortu litezke.

Laster argitaratuko dut Auzitegi Gorenaren ebaluazioak eta 230. artikuluari buruzko azken ebazpenak nola eragin dezaketen AI sortzailearen etorrerari buruzko nire azterketa. Adi hurrengo argitalpen horri!

Itzuli IA sortzaile gisa ezagutzen den gizartearen berrikuntza teknologiko ikaragarriari tartea eman beharko geniokeen iritzi zorrotzari. Batzuek esango lukete ustezko copyright-urraketa gertatu edo gertatzen ari bada ere, gizarte osoak prest egon beharko lukeela hori onartzeko AI sortzailea aurrera eramateko helburu zehatzetarako.

Itxaropena da AIren lege berriak kontu handiz landu eta sintonizatuko liratekeela AI sortzailerako datuen prestakuntzarekin lotutako xehetasunekin.

Kontraargudio ugari daude horretarako AIren lege berriak sortzearen ideia honen aurrean. Kezka bat da AI-ren lege berri batek egile-eskubideen urraketa guztietarako ateak irekiko dituela. Deitoratu egingo dugu AI lege berri horiek liburuetan sartzen utzi genituen eguna. Hau AI datuen prestakuntzara mugatzen saiatzen bazara ere, besteek zirrikiturik edo trebeki aurkituko dituzte copyright-urraketa erabatekoa eta erabatekoa izango duten zirrikituak.

Argudioak bueltaka doaz.

Bereziki eusten ez duen argudio batek AI bera salatzen saiatzearekin du zerikusia. Kontuan izan AI sortzailea edo AI ikertzaileak eragile errudun gisa aipatzen ditudala. Hauek pertsonak eta enpresak dira. Batzuek iradokitzen dute AI jo behar dugula auzitara eraman beharreko alderdi gisa. Nire zutabean luze eztabaidatu dut oraindik ez diogula AIari pertsona juridikoa egozten, ikus esteka hemen adibidez, eta horrela AI berez zuzendutako horrelako auziak zentzugabetzat hartuko lirateke oraintxe bertan.

Nor edo zer auzitara eraman behar den galderaren gehigarri gisa, honek beste gai mamitsu bat ekartzen du.

Demagun AI-ren aplikazio jakin bat Widget konpainia deituko dugun AI-eko arduradun batek asmatu duela. Widget Company tamaina nahiko txikia da eta ez du diru-sarrera handirik, ezta aktiboetan ere. Haiek auzitaratzeak ez du ziurrenik bila zezakeen aberastasun handiak lortuko. Gehienez ere, gaizki ikusten duzuna zuzentzeko gogobetetasuna besterik ez zenuke izango.

Arrain handiaren atzetik joan nahi duzu.

Hona hemen nola sortuko den. AI sortzaile batek aukeratzen du bere IA sortzailea Big Time Companyren eskura jartzea, ore eta aktibo asko dituen konglomeratu garrantzitsu bat. Widget Company izendatzeko auzi batek helburu hobea izango luke orain, Big Time Company izendatzea ere. Hau David eta Goliath borroka bat da, abokatuek gustuko luketena. Noski, Big Time Company arrantza-amutik kentzen saiatuko da dudarik gabe. Hori egin dezaketen ala ez, berriro ere zalantzazkoa den auzi juridikoa da, eta baliteke itxaropenik gabe lokartuta egotea.

Honetan askoz gehiago sakondu baino lehen, datuen prestakuntzaren ondorioz AI sortzailearen inbasioei buruz erabakigarria den zerbait jarri nahiko nuke mahai gainean. Ziur nago intuizioz konturatzen zarela plagioa eta egile eskubideen urraketa bi pizti desberdinak direla. Asko dute komunean, nahiz eta nabarmen desberdinak diren.

Hona hemen Duke Unibertsitateko deskribapen laburra, biak azaltzen dituena:

«Plagioa hobekien definitzen da beste pertsona baten lana onartu gabeko erabilera gisa. Arazo etiko bat da, eskatzaileak sortu ez zuen lanagatiko kreditu-eskaera bat dakarrena. Beste norbaiten lana plagiatu daiteke lan horren copyright-egoera edozein dela ere. Adibidez, hala ere, plagioa da zaharregia den liburu edo artikulu batetik kopiatzea oraindik egile eskubideen pean egoteko. Onartu gabeko iturri batetik hartutako datuak erabiltzea ere plagioa da, nahiz eta datuak bezalako egiazko materiala egile eskubideen bidez babestuta ez egon. Plagioa, ordea, erraz sendatzen da: materialaren jatorrizko iturriaren aipamen egokia».
«Copyright-eskubideen urraketa, berriz, beste baten lana baimenik gabe erabiltzea da. Lege-arazoa da, lana egile-eskubidez babestuta dagoen ala ez, eta baita zenbat erabiltzen den eta erabileraren helburuaren araberakoa ere. Babestutako lan bat gehiegi kopiatzen badu, edo baimenik gabeko helburu batekin kopiatzen badu, jatorrizko iturria aitortzeak ez du arazoa konponduko. Egile-eskubideen jabearen aldez aurretiko baimena eskatuz soilik saihestuko da urraketa-komisioaren arriskua".

Bi kezka hauen garrantzia azpimarratzen dut, erremedioak horren arabera desberdinak izan daitezkeela konturatu zaitezen. Gainera, biak AI Etika eta AI Zuzenbidea barne hartzen dituzten gogoetetan nahastuta daude, eta merezi dute aztertzea.

Azter dezagun erreklamatutako erremedio edo irtenbide bat. Ikusiko duzu arazo bikoitzetako bat lagun dezakeela, baina ez bestea.

Batzuek azpimarratu dute AIren arduradunek beren iturriak aipatzea besterik ez dutela egin behar. AI sortzaileak idazlan bat ekoizten duenean, saiakeran adierazitako guztiari buruzko aipamen zehatzak sartu besterik ez dago. Eman hainbat URL eta Interneteko edukia zein den erabili den beste zantzu batzuk. Horrek plagioari buruzko kezkarik gabe uzten dituela dirudi. Irteeran egindako idazlanak argi eta garbi identifikatuko luke ekoitzitako idazkerarako zein iturri erabili ziren.

Erreklamatutako irtenbide horretan zalantza batzuk daude, baina 30,000 oineko mailan, demagun plagioaren dilemaren erdi-asebeteko sendabide gisa balio duela. Egile-eskubideen urraketaren azalpenean goian esan bezala, iturri-materiala aipatzea ez da zertan txakurtegitik aterako. Edukiak copyright-a zuela suposatuz, eta beste faktore batzuen arabera, hala nola materialaren zenbat erabili den, zain dagoen copyright-urratzearen ezpata nabarmen eta behin betiko alda daiteke.

Arazo bikoitza da hemen leloa.

Plagioa edo egile eskubideen urraketa frogatzen saiatzea saiatuko da

Egiaztatu!

Hori da denok gure bizitzako hainbat momentutan entzun dugun errefrau ondo higatua.

Badakizu nola doan. Zerbait gertatzen ari dela edo gertatu dela esan dezakezu. Baliteke zure bihotzean jakitea hori gertatu dela. Baina push-versus-shove denean, froga izan behar duzu.

Gaur egungo hizkeran, erakutsi behar duzu ordainagiri, esaten duten bezala.

Nire galdera hau da: Nola frogatuko dugu AI sortzaileak Interneteko edukia modu desegokian ustiatu duela?

Batek suposatzen du erantzunak erraza izan behar duela. AI sortzaileari eskatu edo esaten diozu ateratako idazlan bat egiteko. Ondoren idazlana hartu eta Interneten aurki daitekeenarekin alderatzen duzu. Saiakera aurkitzen baduzu, bam, AI sortzailea atsotitzen den horman iltzatuta daukazu.

Bizitza ez omen da inoiz hain erraza izango.

Imajinatu IA sortzailea lortzen dugula 100 hitz inguru dituen saiakera bat egiteko. Inguruan ibiltzen gara eta Interneteko txoko eta txoko guztietara iristen saiatzen gara, 100 hitz horien bila. 100 hitzak, ordena zehatz berean eta modu berdinean erakusten baditugu, badirudi bero-beroa harrapatu dugula geure burua.

Demagun, hala ere, Interneten itxuraz "konparagarria" den saiakera bat aurkitzen dugula, nahiz eta 80 hitzetatik 100ekin bat datorren. Horrek nahikoa dirudi, agian. Baina imajinatu bat datozen 10 hitzetatik 100 hitzen adibide bat baino ez dugula aurkitzen. Nahikoa al da plagioa gertatu dela edo egile eskubideen urraketa gertatu dela aldarrikatzeko?

Gristasuna existitzen da.

Testua barregarria da horrela.

Konparatu hau testutik irudirako edo testutik arterako zirkunstantziarekin. Sorkuntzako AIak testutik irudirako edo testurako arterako gaitasuna ematen duenean, testu-gonbita sartzen duzu eta AI aplikazioak irudi bat sortzen du zuk emandako gonbitan oinarrituta. Baliteke irudia planeta honetan edo beste edozeinetan ikusi den edozein irudi ez bezalakoa izan.

Bestalde, irudiak existitzen diren beste irudi batzuk gogora ekar ditzake. AI bidez sortutako irudi sortzaileari begiratu diezaiokegu eta heste-senaren arabera esan dezakegu ziur aurretik ikusi dugun beste irudi baten antza duela. Orokorrean, Ikus-entzunezko alderatzeko eta kontrastearen alderdiak apur bat errazago hartzen dira. Hori esanda, jakin ezazu lege-eztabaida handiek bermatzen dutela irudi baten gainjartzea edo erreplikatzea zer den.

Musikarekin antzeko beste egoera bat gertatzen da. Badira AI sorkuntzako aplikazioak testu gonbita idazteko aukera ematen dutenak eta AIak sortutako irteera audio musika da. Testu-audio edo testu-musika AI gaitasun hauek oraintxe hasi dira sortzen. Zure dolarrik onenaren alde apustu egin dezakezun gauza bat da AI sortzaileak ekoitzitako musika oso aztertua izango dela arau-hausteengatik. Badirudi badakigula musika-urraketa entzuten dugunean, nahiz eta berriro ere arazo juridiko konplexua den, eta ez den erreplikazioari buruz sentitzen dugun moduan soilik oinarritzen dena.

Utzidazu adibide bat gehiago.

Testutik kodeko sorkuntzako AI-ak testu-gonbita sartzeko aukera ematen dizu eta AIak programazio-kodea sortuko dizu. Ondoren, kode hori erabil dezakezu programa informatiko bat prestatzeko. Baliteke kodea sortu den moduan erabiltzea, edo kodea editatzea eta doitzea aukera dezakezu zure beharretara egokitzeko. Kodea egokia eta funtzionagarria dela ziurtatu beharra dago, sor daitekeen kodean akatsak eta faltsukeriak sor daitezkeelako.

Zure lehen suposizioa izan daiteke programazio-kodea ez dela testua baino desberdina. Testua besterik ez da. Noski, helburu jakin bat ematen duen testua da, baina hala ere testua da.

Tira, ez zehazki. Programazio-lengoaia gehienek formatu eta egitura zorrotza dute hizkuntza horren kodetze-adierazpenen izaerarekin. Zentzu batean, hizkuntza natural askea baino askoz estuagoa da. Kodetze-adierazpenak nola formulatzen diren jakiteko zertxobait kutxatuta zaude. Era berean, enuntziatuak erabiltzeko eta ordenatzeko sekuentzia eta modua nolabait laukituta daude.

Oro har, programazio kodea plagiatuta edo urratu zela erakusteko aukera hizkuntza naturala baino ia errazagoa da. Horrela, AI sortzaile bat Interneten programazio-kodea eskaneatu eta gero programazio-kodea sortzen duenean, kodea nabarmenki errepikatu zela argudiatzeko aukera nahiko sinesgarriagoak izango dira. Ez da slam dunk bat, beraz, espero borroka latzak emango direla honetan.

Nire puntu nagusia da AI-aren etika eta AI Zuzenbidearen arazo berdinak izango ditugula IA sortzailearen modu guztiei aurre egiteko.

Plagioa eta egile-eskubideen urraketa arazotsuak izango dira:

Testutik testura edo testutik saiakerara
Testutik irudira edo testutik artera
Testutik audiora edo testutik musikara
Testutik bideora
Testutik kodea
Eta abar.

Guztiak kezka berdinen menpe daude. Batzuk "frogatzeko" errazagoa izan daiteke beste batzuk baino. Horiek guztiek AI Etika eta AI Legearen oinarriaren amesgaiztoak izango dituzte.

Plagioaren edo copyright-haustearen kasua egitea

Eztabaida helburuetarako, zentratu gaitezen testutik testura edo testutik saiakerarako IA sortzailean. Partzialki egiten dut ChatGPT-en ospe izugarriagatik, hau da, testu-testu AI sortzailearen mota. Jende asko dago ChatGPT erabiltzen duena, beste askorekin batera testutik testurako AI sortzeko aplikazio antzekoak erabiltzen dituztenak.

Badakite AI sorkuntzako aplikazioak erabiltzen ari diren pertsonek plagioan edo copyright urratzean fidatzen ari direla?

Zalantzazkoa dirudi egiten duten.

Ausartuko nintzateke esatera nagusi den suposizioa dela AI sortzailearen aplikazioa erabiltzeko erabilgarri badago, AI-ren sortzaileak edo AI-a landu duen enpresak jakin behar duela edo ziur egon behar duela erabilerarako eskaintzen ari diren salgaietan ez dagoela ezer txarrik. Erabili ahal baduzu, taula gainean egon behar du.

Berrikus dezagun nire lehen iruzkina nola saiatuko garen frogatzen AI sortzaile jakin batek datuen prestakuntzari dagokionez oinarri oker batean funtzionatzen duela.

Era berean, gaineratu dezaket AI sortzaile bat horrela harrapatzen badugu, besteak harrapatzeko aukerak areagotuko direla ziurrenik. Ez dut esaten AI sorkuntzako aplikazio guztiak itsasontzi berean egongo liratekeenik. Baina haietako bat horman itsatsita dagoenean itsaso gogor samarretan aurkituko dira.

Horregatik ere ikaragarri mereziko du dauden auziei begira egoteak. Erreklamatutako arau-hausteari buruz irabazten duen lehenak, hori gertatzen bada, agian gaitzespena eta goibeltasuna esango du beste sorkuntzako AI aplikazioetarako, estutasun batzuk eskuan dauden arazo zabalagoetatik ihes egiten ez badu behintzat. Erreklamatutako arau-hausteari dagokionez galtzen dutenek ez dute zertan esan nahi AI sorkuntzako aplikazioek kanpaiak jo eta ospa dezaketenik. Gerta liteke galera beste faktore batzuei egotzita, beste AI sorkuntzako aplikazioetarako bezain garrantzitsuak ez diren eta abar.

Aipatu nuen 100 hitzeko saiakera bat hartu eta hitz zehatz horiek Interneten sekuentzia berdinean aurkitzen saiatzen bagara, baliteke plagio edo copyright-urratzearen kasu nahiko sendoa izatea, gainerako guztiak berdinak izanik. Baina bat datozen hitzen kopurua txikia bada, izotz mehean gaudela dirudi.

Horretan sakondu nahiko nuke.

Konparaketa bat egitearen alderdi ageriko bat segida zehatz berean dauden hitz berdinek osatzen dute. Hau pasarte osoetan gerta daiteke. Hau antzemateko erosoa izango litzateke, ia zilarrezko erretilu batean emango ziguten bezala.

Susmagarriak izango ginateke ere hitz zati bat bat etorriko balitz. Ideia litzateke ikustea ea ezinbesteko hitzak diren edo agian erraz kendu edo baztertu ditzakegun betegarri hitzak. Ez dugu, halaber, hitzak iraganeko edo geroko denboran erabiltzeak edo beste tontokeriaren bat erabiliz engainatu nahi. Hitzen aldakuntza horiek ere kontuan hartu behar dira.

Beste konparazio-maila bat izango litzateke hitzak ez direnean bereziki hitz berberak neurri handi batean, baina, hala ere, egoera ezberdinean dauden hitzek puntu berdinak ematen dituztela dirudi. Esate baterako, laburpen batek sarritan nahiko antzeko hitzak erabiliko ditu jatorrizko iturri gisa, baina laburpena jatorrizko iturrian oinarrituta dagoela antzeman dezakegu.

Konparazio-mailarik zailena kontzeptu edo ideietan oinarrituko litzateke. Demagun konparazio-oinarri gisa hitz berdinak edo antzekoak ez dituen saiakera bat ikusten dugula, baina funtsa edo ideiak berdinak direla. Lurralde latz batean murgiltzen ari garela, zalantzarik gabe. Ideiak estuki babestuta daudela esango bagenu, ia ezagutzaren eta ezagutzaren handitze-mota guztiak tapatuko genituzke.

Berriro ere Duke Unibertsitateko azalpen erabilgarri bati erreferentzia egin diezaiokegu:

“Copyright-ek ez ditu ideiak babesten, ideia baten adierazpen zehatza baizik. Esaterako, auzitegi batek erabaki zuen Dan Brownek ez zuela aurreko liburu baten egile eskubiderik urratu idatzi zuenean The Da Vinci Code aurreko lanetik maileguan hartu zuen guztia oinarrizko ideiak zirelako, ez argumentuaren edo elkarrizketaren berezitasunak. Egile-eskubideak sormen-ekoizpena bultzatzea denez, beste norbaiten ideiak lan berri eta original bat egiteko erabiltzeak copyrightaren helburuari eusten dio, ez du urratzen. Batek beste baten adierazpena baimenik gabe kopiatzen badu soilik egile-eskubideak urratu daitezke».
«Plagioa saihesteko, aldiz, beste norbaitengandik maileguan hartutako ideien iturria ere aitortu behar da, ideia horien adierazpena haiekin mailegatuta dagoen ala ez kontuan hartu gabe. Beraz, parafrasi batek aipamena eskatzen du, nahiz eta gutxitan sortzen duen copyright arazoren bat».

Kontuan izan arazo bikoitzen alderdien arteko desberdintasunak lehen identifikatu bezala.

Orain, konparazio planteamenduak praktikan jartzea urte asko daramatza. Pentsa ezazu horrela. Ikastetxeko lanetarako idazlanak idazten dituzten ikasleek Internetetik edukia hartzeko tentazioa izan dezakete eta A-mailako Pulitzer saria irabazi duten hitzen egileak direla irudikatzeko.

Irakasleak aspalditik ari dira plagioa egiaztatzeko programak erabiltzen horri aurre egiteko. Irakasle batek ikasle baten idazlana hartzen du eta plagioaren egiaztatzailean sartzen du. Zenbait kasutan, ikastetxe oso batek plagioa egiaztatzeko programaren erabilera lizentzia emango du. Ikasleek idazlan bat bidaltzen duten bakoitzean, plagioa egiaztatzeko programara bidali behar dute idazlana. Irakasleari programak jasotzen duenaren berri ematen zaio.

Zoritxarrez, oso kontuz ibili behar duzu plagioa egiaztatzeko programa hauek esaten dutenarekin. Garrantzitsua da kontu handiz baloratzea jakinarazitako zantzuak baliozkoak diren ala ez. Esan bezala, lan bat kopiatu den ala ez jakiteko gaitasuna lausoa izan daiteke. Egiaztapen-programaren emaitza ustekabean onartzen baduzu, faltsuki leporatu diezaiokezu ikasle bati kopiatzea egin ez zuenean. Hau arima birringarria izan daiteke.

Aurrera, plagioa egiaztatzeko programak erabiltzen saiatu gaitezke AI sorkuntzako irteerak probatzeko esparruan. Tratatu AI sorkuntzako aplikazio batetik ateratako idazlanak ikasle batek idatzitakoak bezala. Ondoren, plagioaren egiaztatzaileak zer dioen neurtzen dugu. Hau gatz ale batekin egiten da.

Badago azken ikerketa-ikerketa bat, konparazio mota hauek AI sortzailearen testuinguruan modu honetan funtzionatzen saiatu zena. Aurkikuntza interesgarri batzuk errepasatu nahiko nituzke zurekin.

Lehenik eta behin, atzeko plano batzuk behar dira. AI sortzailea batzuetan LLM (hizkuntza-eredu handiak) edo, besterik gabe, LM (hizkuntza-eredu) deitzen da. Bigarrenik, ChatGPT GPT-3.5 izeneko OpenAI sortzaileko AI pakete baten bertsio batean oinarritzen da. GPT-3.5 baino lehen, GPT-3 zegoen, eta aurretik GPT-2. Gaur egun, GPT-2 nahiko primitibotzat jotzen da ondorengo seriearekin alderatuta, eta denok irrikaz gaude GPT-4-ren aurkezpenaren zain, ikusi nire eztabaida hemen. esteka hemen.

Laburki aztertu nahi dudan ikerketa ikerketa GPT-2 aztertzean izan zen. Garrantzitsua da konturatzea, orain GPT-2-ren gaitasunetatik haratago gaudelako. Ez egin ondorio xumerik GPT-2-ren analisi honen emaitzei buruz. Hala ere, GPT-2-ren ebaluaziotik asko ikas dezakegu. Azterketak "Hizkuntza ereduek plagiatzen al dute?" Jooyoung Lee, Thai Le, Jinghui Chen eta Dongwon Leeren eskutik, ACM WWW '23, 1ko maiatzaren 5etik 2023era, Austin, TX, AEB.

Hau da haien ikerketa galdera nagusia:

"Noraino (memorizaziora mugatu gabe) LMek beren prestakuntza laginetako esaldiak edo esaldiak ustiatzen dituzte?"

Balizko plagioaren hiru maila edo kategoria hauek erabili zituzten:

"Hitzezko plagioa: eraldaketarik gabeko hitzen edo esaldien kopia zehatzak".
"Plagio parafraseatua: sinonimoen ordezkapena, hitzen berrantolaketa eta/edo atzera-itzulpena".
"Ideia plagioa: oinarrizko edukiaren irudikapena forma luzanga batean".

GPT-2 Interneteko datuetan trebatu zen, beraz, analisi mota honetarako hautagai egokia:

"GPT-2 WebText-en aldez aurretik trebatuta dago, eta Reddit-eko 8 milioi esteketatik eskuratutako 45 milioi dokumentu baino gehiago ditu. OpenAIk WebText publikoki kaleratu ez duenez, OpenWebText erabiltzen dugu, hau da, WebText corpusaren kode irekiko birsorkuntza bat da. Aurretiko literaturak fidagarritasunez erabili du».

Ikerketatik ateratako funtsezko aurkikuntza selektiboak hauek dira:

"Aurrez prestatutako GPT-2 familiek OpenWebText-etik plagiatzen dutela deskubritu dugu".
"Gure aurkikuntzek erakusten dute doikuntzak nabarmen murrizten dituela OpenWebText-en hitzez hitz plagio kasuak".
“Carlini et al. eta Carlini et al., GPT-2 modelo handiek (handiak eta xl) oro har plagiatutako sekuentziak txikiagoek baino maizago sortzen dituztela ikusten dugu.
"Hala ere, LM ezberdinek plagio-eredu desberdinak erakutsi ditzakete, eta, beraz, gure emaitzak agian ez dira zuzenean beste LM batzuetara orokortzea, GPT-3 edo BLOOM bezalako LM berriagoak barne".
«Gainera, plagio-detektagailu automatikoek hutsegite modu asko dituztela ezagutzen da (negatibo faltsuetan zein positibo faltsuetan).
"Kontuan izanik LMen prestakuntza-datu gehienak saretik ateratzen direla edukien jabeei jakinarazi gabe, haien hitzak, esaldiak eta baita trebakuntza-multzoetako ideia nagusiak ere sortutako testuetan errepikatzeak ondorio etikoak ditu".

Zalantzarik gabe, mota honetako ikasketa askoz gehiago behar ditugu.

GPT-2 datuen prestakuntzari dagokionez GPT-3 GPT-XNUMX-rekin alderatzen den jakiteko jakin-mina baduzu, nahiko kontraste nabarmena dago.

Jakinarazitako zantzuen arabera, GPT-3rako datuen prestakuntza askoz zabalagoa zen:

“Eredua interneteko testu datu-baseak erabiliz trebatu zen. Honek liburu, web testu, Wikipedia, artikulu eta interneteko beste idazki batzuetatik lortutako 570 GB datu izugarriak barne hartzen zituen. Are zehatzago esateko, 300 milioi hitz sartu ziren sistemara” (BBC Science Focus aldizkaria, "ChatGPT: OpenAI-ren GPT-3 tresnari buruz jakin behar duzun guztia" Alex Hughes-ek, 2023ko otsaila).

GPT-3rako datuen prestakuntzaren deskribapen sakonagoetan interesa duzuenontzat, hona hemen GitHub-en argitaratutako GPT-3 eredu-txartel ofizialaren pasarte bat (2020ko irailean zerrendatutako azken eguneratze-data):

"GPT-3 prestakuntza-datu multzoa Internetera argitaratutako testuz edo Internetera kargatutako testuz osatuta dago (adibidez, liburuak). Orain arte trebatu eta ebaluatu diren Interneteko datuek honako hauek dira: (1) CommonCrawl datu-multzoaren bertsioa, kalitate handiko erreferentzia-corpusen antzekotasunean oinarrituta iragazitakoa, (2) Webtext datu-multzoaren bertsio hedatua, (3). ) Interneteko bi liburu-corpus, eta (4) ingelesezko Wikipedia".
"Bere prestakuntza-datuak kontuan hartuta, GPT-3-ren irteerak eta errendimendua Internetera konektatutako populazioen adierazgarriagoak dira hitzezko kultura ez-digitalean murgilduta daudenak baino. Internetera konektatutako biztanleria herrialde garatuen, aberatsen, gazteen eta gizonezkoen iritzien adierazgarriagoa da, eta gehienbat AEBetan oinarritzen da. Herrialde garatuetako nazio eta populazio aberatsek Interneten sartze handiagoa erakusten dute. Genero eten digitalak sarean emakume gutxiago ordezkatuta ere erakusten du mundu osoan. Gainera, munduko leku ezberdinek Interneten sartze eta sarbide maila desberdinak dituztenez, datu-multzoak gutxiago konektatuta dauden komunitateak azpimarratzen ditu.

GPT-3-ri buruzko goiko adierazletik ateratako bat da AI sortzailea egiten dutenen artean, zenbat eta Interneteko datu gehiago eskaneatu, AI sortzailea hobetzeko edo aurreratzeko aukerak gora egiten duela.

Hau bi modutara begiratu dezakezu.

1) AI hobetua. Interneten ahalik eta gehien arakatzen duen sormenezko IA izango dugu. Emaitza zirraragarria da AI sortzailea lehendik dagoena baino hobea izango dela. Hori aurrera begira egoteko zerbait da.
2) Potentzial ugari kopiatzen. Interneten eskaneatzearen hedapen honek plagioaren eta egile-eskubideen urraketaren arazoa gero eta handiagoa egiten du. Aurretik eduki-sortzaile askok eraginik ez zuten arren, tamaina loratzen joango da. Eduki sortzaileen alboko abokatua bazara, horrek malkoak ekartzen dizkizu begietara (beharbada, atsekabeko malkoak, edo poz-malkoak, auziei dagokienez horrek ekartzen dituen aukerak).

Edalontzia erdi beteta ala erdi hutsik al dago?

Zuk erabaki.

Legezko Minak Zain

Hausnartzen ari zaren galdera bat da argitaratutako Interneteko edukia eskaneatzeko joko bidezkotzat ote den. Zure edukia ordainpeko horma baten atzean badago, ustez ez da eskaneatzeko xedea, ezin baita erraz iritsi, ordain-hormaren indarraren arabera.

Uste nuke eguneroko jende gehienek ez dutela edukia ordainpeko horma baten atzean gordeta. Beren edukia publikoki eskuragarri egotea nahi dute. Jendeak begirada bat botako duela suposatzen dute.

Zure edukia publikoki eskuragarri izateak ere esan nahi du axiomatikoki datu entrenatzen ari den AI sortzaileak eskaneatzea onartzen ari zarela?

Agian bai, agian ez.

Begiak biribiltzeko legezko gai horietako bat da.

Lehen aipaturikora itzuliz Bloomberg legea artikuluan, egileek webgune askorekin lotutako Baldintzen eta Baldintzen garrantzia aipatzen dute:

"Legezko lur-mina, datuen arazketarako lineako bot-ak lantzen dituzten AI enpresek ikaragarri jaramonik egiten ez dutena, mota guztietako webgune publikoetan normalean eskuragarri dauden Zehaztapen eta Baldintzetan ezkutatuta dago. Gaur egun konpondu gabeko IP legearekin eta egile-eskubideen urraketaren dilemarekin alderatuta, webgune baten Baldintzak ondo finkatutako kontratu-legeak babesten ditu eta normalean epaitegietan bete daitezke aurrekari kopuru nahikoan oinarrituz".

Adierazten dute zure webguneak lizentziekin lotutako orri bat duela suposatuz, litekeena da egungo txantiloi estandarizatu bat erabili baduzu, klausula erabakigarri bat edukitzea:

"Ondorioz, webguneen baldintza eta baldintza gehienek, doako sarbidean eskuragarri daudenak, klausula bat daukate datu-scraping automatizatua debekatzeko. Ironikoki, doan eskuragarri dauden txantiloiak ChatGPT prestakuntzarako erabili izan dira. Hori dela eta, eduki-jabeek beren Baldintzak berrikusi eta aparteko klausula bat txertatu nahi dute webguneetako edozein edukiren erabilera AI prestakuntzarako edo erlazionatutako helburuetarako, eskuz edo automatikoki bilduta, webgunearen jabearen aldez aurretik idatzitako baimenik gabe. ”.

Kicker gehigarri bat sartzen da eduki-sortzaileek euren webguneei buruz egin ditzaketen ekintzen azterketan:

"Beraz, urratzerik gabeko klausula hauste bakoitzeko kalte-ordain likidagarrien xedapen betearazgarria txertatzea, fidantzarik gabeko xedapen batekin indartuta, irtenbide iraunkor bat izan daiteke sormen-edukien egileentzat, beren fruituak emateko gogorik ez dutenentzat. lan intelektuala AI prestakuntza helburuetarako ordaindu gabe edo, gutxienez, beren lanagatik kreditu egokia eman gabe”.

Baliteke horri buruz zure abokatuari kontsultatzea.

Batzuek diote hori ezinbesteko modua dela AI-eko arduradunei esateko eduki-sortzaileek oso serio ari direla euren edukia babesteko. Zure lizentziak idazkera egokia duela ziurtatzeak, badirudi AI arduradunak jakinaraztea.

Beste batzuk, ordea, apur bat beherakoak dira. Atsekabetuta esaten dute zure webgunean hizkera juridikorik gogor eta hilgarriena jar dezakezula jar dezakezula, baina azkenean, AI-en arduradunek eskaneatu egingo dute. Ez duzu jakingo hori egin zutenik. Garai bateko deabru bat izango duzu egin zutela frogatzen. Nekez ikusiko duzu haien irteerak zure edukia islatzen duela. Irabaziko ez duzun borroka maldan gora da.

Kontraargudioa da gudua eman baino lehen errenditzen ari zarela. Gutxienez hizkera juridiko nahikorik ez baduzu, eta inoiz harrapatzen badituzu, edozein ardurari ihes egiteko bidea astinduko dute. Guztia ez duzulako idatzizko hizkuntza mota egokia argitaratu.

Bien bitartean, indarra lortu nahi duen beste ikuspegi bat izango litzateke markatzea zure webgunea gunea AI sortzaileak eskaneatu behar ez duela dioen zerbaitekin. Ideia da marka estandarizatu bat asmatuko litzatekeela. Webguneek markatzailea beren webgunean gehi dezakete. AI-eko arduradunei esango lieke euren datuen eskaneamendua aldatu behar dutela markatutako webguneak saltatzeko.

Markatzaileen hurbilketa arrakastatsua izan al daiteke? Kezkak markatzaileak lortzeko eta argitaratzeko kostuak dira. AI-eko arduradunek markatzaileak beteko dituzten eta markatutako guneak eskaneatzea saihesten dutela ziurtatuko dute. Beste ikuspuntu bat da AI-eko arduradunek markekin bat egiten ez badute ere, horrek epaitegietara jotzeko eta eduki-sortzaileak azken kilometroa egin zuela AI eskaneatzeaz ohartarazten saiatzeko beste arrasto bat ematen du.

Bai, denak burua bira ematen dizu.

Ondorioa

Gai arantzatsu honi buruzko azken ohar batzuk.

Prest al zaude plagiatzaile eta copyright-urratzaile gisa AI osoari buruzko ikuspegi hunkigarria izateko?

Plagioaren edo egile-eskubideen urraketaren ekintzetan AI sortzailea "harrapatzearen" hipotesiaren zati handi bat irteerak aurkitzean oinarritzen da. antza handia dute aurreko lanak, hala nola, datu-prestakuntzan zehar eskaneatu ziren Interneten edukia.

Demagun, baina, zatitu eta konkistatzeko trikimailua jokoan dagoela hemen.

Horra hor zer esan nahi dudan.

AI sortzaileak hemendik pixka bat eta handik pixka bat mailegatzen badu, azken finean, elkarrekin nahastuz, edozein emaitza ekoizteko, momentu gotxa bat izateko aukerak izugarri murrizten dira. Irteera edozein ez omen da nahikoa atalase batera igoko, ziur esan dezakezun iturri jakin batetik atera dela. Ondoriozko idazlana edo beste irteera-moduak zatika baino ez dira parekatuko. Eta plagioa edo egile-eskubideen urraketa gertatu dela argudiatzen saiatzeko ohiko planteamenduaren arabera, normalean txiki-txiki batzuk jokoan dagoena baino gehiago erakutsi behar duzu, batez ere zatia nabarmena ez bada eta Interneten oso zabala aurki daitekeen (azpikopurua). bidegabeko jabetzaren frogaren zama egokirik).

AI sortzailearen datuen prestakuntzak webguneak eta eduki-sortzaileak erauzi dituela deklaratu al dezakezu oraindik, nahiz eta iradokitako froga proportzio itxuraz inmateriala izan?

Pentsa ezazu.

Baliteke plagioari eta egile-eskubideen urraketa neurrian jasaten baditugu, baliteke plagioa eta/edo copyright-urraketa zer den definitzeko ikuspegia aldatu behar izatea. Agian plagio edo egile-eskubideen urraketa kasu bat egin behar da nagusiki edo orokorrean. Milaka edo milioika zati txikiz osatutako mosaiko bat urraketa horiek egiten dituela ulertu liteke. Itxurazko arazoa da, hala ere, horrek eduki mota guztiak bat-batean urraketen aterki baten azpian sar ditzakeela. Hau aldapa irristakorra izan daiteke.

Pentsamendu astunak.

Pentsamendu potoloez mintzatuz, Leo Tolstoi idazle mitikoak esan zuen: "Bizitzaren zentzu bakarra gizateria zerbitzatzea da".

Zure webgunea eta besteen webguneak AIaren hobekuntzarako eskaneatzen ari badira, eta horrengatik zentimo bakar bat ere lortzen ez baduzu ere, kontsolamendu solemne izango al zenuke gizateriaren etorkizunari laguntzen ari zarela sinesmen sutsuan? Ordaindu beharreko prezio txikia dirudi.

Beno, AI gizaki guztiak existentziatik kentzen dituen arrisku existentzial beldurgarria izan ezik. Ez zenuke horren meriturik hartu behar. Suposatzen dut laster ez duzula emaitza latz horretan lagunduko. Iragarpen negargarri hori alde batera utzita, pentsa liteke AI-eko arduradunek beren AI sortzailearekin dirua irabazten badute eta badirudi mozkinarekin gozatzen ari direla, zuk ere tarta zati bat lortu beharko zenuke. Partekatu eta partekatu berdin. AI-eko arduradunek edozein webgune eskaneatzeko baimena eskatu beharko lukete eta, ondoren, eskaneatzea egiteko baimena izanagatik ordaindu beharreko prezioa ere negoziatu beharko lukete.

Eman kreditua zor den tokian.

Eman diezaiogun Sir Walter Scotti oraingoz azken hitza: “Ai, zer sare korapilatsua ehuntzen dugun. Lehenengo aldiz engainatzea praktikatzen dugunean».

Hau beharbada iruzurra martxan dagoela uste baduzu, edo agian ez da aplikatzen dena ondo eta guztiz zuzen eta zilegi dela uste baduzu. Mesedez, eman eskuzabalki zure buruari hau pentsatzeagatik. Merezi duzu.

Iturria: https://www.forbes.com/sites/lanceeliot/2023/02/26/legal-doomsday-for-generative-ai-chatgpt-if-caught-plagiarizing-or-infringing-warns-ai-ethics- eta-ai-legea/