ChatGPT V4-k barra, SATs eta ETH kontratuetan ustiapenak identifikatu ditzake

GPT-4, Adimen Artifizialaren (AI) txatbotaren azken bertsioak, ChatGPT, batxilergoko probak eta zuzenbideko ikasketak gainditu ditzake 90. pertzentilean puntuazioekin eta aurreko bertsioarekin posible ez ziren prozesatzeko gaitasun berriak ditu.

GPT-4-ren proben puntuazioen zifrak martxoaren 14an partekatu zituen OpenAI sortzaileak eta agerian utzi zuen irudi, audio eta bideo sarrerak testu bihur ditzakeela, "argibide askoz ñabartuagoak" modu sortzaileagoan eta fidagarriagoan kudeatzeaz gain.

"Barren azterketa simulatu bat gainditzen du probak egiten dituztenen % 10eko puntuazioarekin", gehitu du OpenAIk. "Aitzitik, GPT-3.5-en puntuazioa beheko %10aren ingurukoa zen".

Kopuruek erakusten dute GPT-4-k 163ko puntuazioa lortu zuela 88. pertzentilean LSAT azterketan - probako unibertsitateko ikasleek Estatu Batuetan gainditu behar dute zuzenbide eskolan sartzeko.

*GPT-4 eta GPT-3.5 azterketaren emaitzak AEBetako azken azterketetan. Iturria:* *OpenAI*

GPT4-ren puntuazioa egoera onean kokatuko litzateke 20 zuzenbide-eskola onenen batean sartzeko eta Harvard, Stanford, Princeton edo Yale bezalako ikastetxe ospetsuetan onartzeko beharrezkoak diren puntuazioetatik puntu gutxi batzuk baino ez dira falta.

ChatGPT-ren aurreko bertsioak 149 puntu bakarrik lortu zituen LSAT-en beheko %40an jarriz.

GPT-4-k 298etik 400 puntu lortu zuen Uniform Bar Exam-en, AEBetako edozein jurisdikziotan abokatu gisa jarduteko aukera ematen dien zuzenbide lizentziatu berri diren ikasleek egindako proba.

*UBE puntuazioak AEBetako jurisdikzio bakoitzean abokatua praktikatzeko onartu behar ziren. Iturria:* *Abokatuen Aztertzaileen Konferentzia Nazionala*

ChatGPT-ren bertsio zaharrak zailtasunak izan zituen proba honetan, eta beheko %10ean amaitu zuen 213etik 400 puntuarekin.

AEBetako batxilergoko ikasleek unibertsitateko prestutasuna neurtzeko egindako SAT ebidentzian oinarritutako irakurketa eta idazketa eta SAT Matematika azterketei dagokienez, GPT-4-k 93. eta 89. pertzentilean lortu zuen hurrenez hurren.

GPT-4 zientzia "gogor"etan ere nabarmendu zen, AP Biologian (% 85-100), Kimika (% 71-88) eta Fisika 2 (% 66-84) pertzentilen puntuazioen gainetik.

Hala ere bere AP Calculus puntuazioa nahiko batez bestekoa izan zen, 43r eta 59. pertzentilean kokatuz.

GPT-4ri falta zitzaion beste arlo bat Ingelesezko Literaturako azterketetan zegoen, 8. eta 44. pertzentilean puntuazioak bi probetan banatuta.

OpenAIk esan zuen GPT-4 eta GPT-3.5-ek 2022-2023 praktika-azterketetatik egin zituzten proba hauek, eta hizkuntza prozesatzeko tresnek "prestakuntza espezifikorik" ez zutela hartu:

«Azterketa hauetarako ez genuen prestakuntza espezifikorik egin. Azterketetako arazoen gutxiengoa ereduak ikusi zituen entrenamenduetan, baina emaitzak adierazgarriak direla uste dugu».

Emaitzek beldurra piztu zuten Twitterren komunitatean ere.

Zerikusia: Nola eragingo dio ChatGPT-k Web3 espazioari? Industriaren erantzunak

Nick Almond, FactoryDAOren sortzailea esan bere Twitterreko 14,300 jarraitzaile martxoaren 14an GPT4k "jendea uxatzen" duela eta hezkuntza sistema globala "kolapso" egingo duela.

Ebaluazio-teoria nire bizitzako zati handi bat izan zen hainbat urtez. Duela urte asko zetorren egun honi buruz jotzen ari nintzen. Literalki, garai hartan egoiliarren biradera bezalakoa nuen.
Baina... benetan horrek esan nahi du ebaluazio zaindua izan ezik, puntu honetatik aurrera amaitu dela.
— drnick ️² (@DrNickA) Martxoaren 14, 2023

Coinbaseko zuzendari ohiak, Conor Groganek, esan zuen zuzeneko Ethereum kontratu adimenduna txertatu zuela GPT-4-n eta berehala hainbat "segurtasun ahultasun" adierazi zituen eta kodea nola ustiatu daitekeen zehaztu zuen:

Zuzeneko Ethereum kontratu bat GPT-4-ra bota nuen.
Une batean, segurtasun ahultasun batzuk nabarmendu zituen eta kontratua ustiatu daitekeen azalerak adierazi zituen. Orduan, kontratua ustiatzeko modu zehatz bat egiaztatu zuen pic.twitter.com/its5puakUW
— Conor (@jconorgrogan) Martxoaren 14, 2023

Lehenago ChatGPT-en kontratu adimendunen auditoriak aurkitu zuen bere lehen bertsioa ere gai zela kode-akatsak zentzuzko maila batean antzemateko.

Rowan Cheung-ek, "The Rundown" AI buletinaren sortzaileak GPT-ren bideo bat partekatu zuen paper batean eskuz marraztutako webgune faltsu bat kode batean transkribatzen.

Ikusi berri dut GPT-4 eskuz marraztutako zirriborro bat webgune funtzional bihurtzen.
Hau erokeria da. pic.twitter.com/P5nSjrk7Wn
— Rowan Cheung (@rowancheung) Martxoaren 14, 2023