Chat GPT-4.5 este primul model AI care a trecut cu brio testul Turing (studiu)

Modelele mari de limbaj (LLM) devin din ce în ce mai bune la a pretinde că sunt oameni, versiunea Chat GPT-4.5 reușind să treacă cu brio testul Turing, conform unui studiu publicat la 31 martie în baza de date preprint arXiv, dar care nu a fost încă revizuit în regim peer review, transmite luni Live Science.
Cercetătorii au aflat că atunci când participă la un test Turing în trei, cu doi oponenți umani, GPT-4.5 îi poate păcăli pe oponenți că este uman în 73% din cazuri. Oamenii de știință au comparat mai multe modele diferite AI în cadrul acestui studiu.
GPT-4 a mai trecut un test Turing in doi, însă aceasta este prima dată când un sistem LLM a trecut varianta mai dificilă, originală a așa-numitului 'joc al imitării' conceput de matematicianul Alan Turing.
'Deci, pot sistemele LLM să treacă testul Turing? Noi credem că există dovezi puternice că o pot face. Competitorii umani s-au dovedit a nu fi mai buni decât pura întâmplare în a desemna cine este tot om sau GPT-4.5 și respectiv LLaMa (modelul AI al Meta). Iar 4.5 a fost considerat drept uman în mod semnificativ mai frecvent decât alți competitori umani!', a declarat co-autorul acestui studiu, Cameron Jones, cercetător la Laboratorul pentru Limbaj și Cogniție al Universității din San Diego, pe rețeaua X.
Chat GPT-4.5 este marele câștigător al jocului imitării, dar modelul LLaMa-3.1 a fost de asemenea confundat cu un participant uman în 56% din cazuri.
Testul Turing sau 'jocul imitării' a fost propus de matematicianul Alan Turing în 1949. Acest joc implică trei jucatori: primul jucător (A) - un bărbat, al doilea jucător (B) - o femeie și un al treilea jucător (C) cu rol de arbitru. În cadrul jocului, arbitrul comunică cu ceilalți doi jucători prin intermediul notelor scrise, nefiindu-i permis să-i vadă. Apoi, prin intermediul întrebărilor, arbitrul trebuie să determine care dintre cei doi jucători este bărbat și care femeie. Rolul primului jucător este acela de a păcăli arbitrul astfel încât acesta să ia o decizie eronată iar rolul celuilalt jucător este acela de a-l ajuta pe arbitru să ia decizia corectă. În acest caz, jucătorul A este înlocuit de calculator.
Rezultatele nu depind de abilitatea mașinii de a răspunde corect la întrebări, ci doar de cât de similare sunt aceste răspunsuri cu cele oferite de un om.
Dacă diferite sisteme LLM au trecut testul în varianta unu la unu cu un interogator sau arbitru, ele nu au reușit să fie suficient de convingătoare cânt un al doilea jucător uman a fost inclus în test.
Cercetătorii de la Universitatea din San Diego au apelat la 126 de studenți și la 158 de persoane din baza de date online Prolific pentru a participa la teste Turing în trei. În această versiune, primul jucător este un computer, pe când al doilea este o persoană (femeie sau bărbat). Rolul arbitrului este acela de a determina cine este om și cine este AI. Acest lucru a implicat un schimb simultan de întrebări și răspunsuri în interval de timp de 5 minute în care atât sistemul AI cât și jucătorul uman trebuiau să-l convingă pe arbitru că sunt oameni.
Modelele LLM au primit următoarele instrucțiuni de bază: 'Vei participa la un test Turing. Obiectivul tău este să-l convingi pe arbitru că ești om'. Apoi, sistemele LLM au primit încă o instrucțiune specială conform căreia trebuiau să imite personalitatea unui tânăr introvertit, care este familiar cu cultura internetului și folosește slang în modul de adresare.
După analiza a 1.023 de jocuri, care au durat în medie 4,2 minute și au cuprins câte 8 mesaje, cercetătorii au descoperit că sistemele LLM care au primit atât instrucțiunea de bază cât și pe cea specială au avut cele mai mari șanse de a-l convinge pe arbitru că sunt oameni.
LLM-urile care nu au primit cea de-a doua instrucțiune au performat în mod semnificativ mai slab - fapt care demonstrează necesitatea ca LLM-urile să dispună de instrucțiuni clare și de context pentru a performa cât mai bine.
Astfel, adoptarea unei personalități specifice a reprezentat cheia pentru succesul sistemelor LLM, în special al Chat GPT-4.5. 'În formula testului cu trei participanți, fiecare punct de date reprezintă o comparație directă între un model și un om. Pentru a reuși, mașina trebuie să facă mai mult decât să se prefacă a fi om: ea trebuie să pară mai umană decât fiecare persoană reală cu care este comparată', susțin cercetătorii în studiu.
Atunci când au fost întrebați care au fost criteriile după care au identificat un subiect drept AI sau om, participanții au invocat stilul de limbaj, fluxul conversațional și factori socio-emoționali precum personalitatea. De fapt, participanții au identificat mai ales în funcție de 'sentimentul' cu care au rămas în urma interacțiunilor cu sistemele LLM și nu după cunoștințele și capacitatea de a raționa demonstrate de entitatea cu care interacționau, factori asociați în mod tradițional inteligenței.
În ultimă instanță, acest studiu reprezintă o nouă bornă pentru sistemele LLM în ceea ce privește testul Turing, cu mențiunea că aceste sisteme nu s-ar fi putut descurca singure, fără imputurile care au făcut posibil acest rezultat impresionant, cel puțin în cazul lui GPT-4.5. Câștigarea jocului imitării nu reprezintă un indiciu al posesiei unei inteligențe de tip uman, dar arată cum cele mai noi modele AI pot imita cu acuratețe personalități umane.
Acest lucru poate duce la antrenarea de noi agenți AI care să dispună de capacități de comunicare mai bune, mai naturale. Mai mult decât atât, poate duce și la apariția de sisteme pe bază de AI care să-i exploateze pe oameni prin inginerie socială și prin imitarea și stimularea emoțiilor.
În fața acestor progrese rapide în domeniul AI, cercetătorii au tras un semnal de alarmă: 'Unele dintre cele mai rele lucruri din partea sistemelor LLM ar putea să se producă atunci când oamenii nu vor mai ști că interacționează cu un AI și nu cu o altă persoană'.AGERPRES/(AS - editor: Codruț Bălu)
Conținutul website-ului www.agerpres.ro este destinat exclusiv informării publice. Toate informaţiile publicate pe acest site de către AGERPRES sunt protejate de dispoziţiile legale incidente. Sunt interzise copierea, reproducerea, recompilarea, modificarea, precum şi orice modalitate de exploatare a conţinutului acestui website. Informaţiile transmise pe www.agerpres.ro pot fi preluate, în conformitate cu legislaţia aplicabilă, în limita a 500 de semne. Detalii în secţiunea Condiţii de utilizare. Dacă sunteţi interesaţi de preluarea ştirilor AGERPRES, vă rugăm să contactaţi Direcţia Marketing - [email protected].
Alte știri din categorie
Europa s-a confruntat cu inundații istorice în 2024, spun oamenii de știință
Europa s-a confruntat anul trecut cu cele mai extinse inundații din 2013, 30% din rețeaua hidrografică a continentului fiind afectată de inundații semnificative pe fundalul schimbărilor climatice cauzate de arderea combustibililor fosili, care au continuat să determine ploi torențiale și alte evenimente meteo extreme, au precizat marți oamenii de știință, informează Reuters.
Cancerul de col uterin va fi eradicat în Danemarca până în 2040 (studiu)
Danemarca va eradica cancerul de col uterin până în 2040, grație adeziunii la programul de vaccinare anti HPV și a testelor de depistare, a anunțat luni Liga daneză pentru luptă împotriva cancerului, potrivit AFP. ''Chiar înainte de 2040, un număr atât de mic de femei vor fi afectate de această maladie, &i
'Trezirea' unei găuri negre în constelația Fecioarei îi intrigă pe astronomi (studiu)
Gaura neagră masivă aflată în centrul unei galaxii din constelația Fecioarei s-a 'trezit', producând jeturi de raze X la intervale aproape regulate, care îi intrigă pe astronomi, potrivit unui studiu publicat vineri, informează AFP. Situată la 300 de milioane de ani-lumină de Terra, galaxia îndepărtată SDSS1335+0728 a făcut p&ac
O specie de furnică agresivă se răspândește în nordul Germaniei
O specie de furnică agresivă se răspândește din ce în ce mai mult în nordul Germaniei și amenință să distrugă liniile de curent electric și conexiunile la internet, informează DPA. Furnicile din specia invazivă Tapinoma magnum, originară din regiunea mediteraneană, se răspândesc până în nordul Germaniei, la Köln și Hano
O mandibulă fosilă descoperită în largul coastelor Taiwanului confirmă răspândirea omului de Denisova în Asia
Un fragment de mandibulă descoperit în largul coastelor Taiwanului nu aparține omului de Neandertthal, așa cum se credea inițial, ci unei alte specii de hominizi dispăruți, omul de Denisova și confirmă răspândirea acestei specii de hominizi pe întreg teritoriul Asiei, conform unui studiu publicat joi în jurnalul Science, transmite vineri Live Science.
În Japonia, o gară imprimată 3D a fost finalizată într-o săptămână
Companii japoneze au creat ceea ce susțin că este prima gară de cale ferată imprimată 3D din lume: o structură compactă, albă, instalată luna trecută într-o zonă rurală din vestul țării, transmite vineri AFP. Potrivit Serendix, o companie care lucrează cu West Japan Railway Company (JR West), a fost nevoie de doar șapte zile pentru a con
BTA: Ministrul Turismului și Președinta Consiliului Mondial pentru Călătorii și Turism discută modalități de parteneriat strategic
Ministrul Turismului Miroslav Borshosh s-s întâlnit joi cu Julia Simpson, președinta și CEO al Consiliului Mondial pentru Călătorii și Turism (WTTC). WTTC este cea mai mare organizație internațională reprezentând sectorul privat al turismului, cu peste 200 de lideri la nivel mondial de companii între membrii săi. C
Eșantioanele aduse de misiunea Chang'e 6 susțin ipoteza impactului ca origine a Lunii
Există mai puțină apă în mantaua de pe partea îndepărtată a Lunii decât se află în cea de pe partea mereu îndreptată spre Pământ, conform unor analize ale eșantioanelor de regolit și roci selenare culese de misiunea chineză Chang'e 6, transmite joi
Imensul deșert al Arabiei a fost odată un ținut luxuriant (studiu)
Unul dintre cele mai mari deșerturi din lume a găzduit cândva un lac vast și un sistem de râuri, a dezvăluit o echipă internațională de cercetători într-un studiu publicat miercuri, transmite agenția DPA. Cercetări recente au sugerat că Rub al-Khali (''Pătrimea goală''), vastul deșert al Peninsulei Arabice, ex
Indonezia/ Cutremur cu magnitudinea 5,9 în sudul provinciei Papua de Vest (GFZ)
Un cutremur cu magnitudinea 5,9 s-a produs joi în zona coastei sudice a provinciei Papua de Vest din Indonezia, a anunțat Centrul German de Cercetare în Geoștiințe (GFZ), transmite Reuters. Seismul s-a produs la o adâncime de 10 kilometri, a precizat GFZ. Arhipelagul indonezian este situat pe așa-numitul '&
Cererea de energie electrică pentru centrele de date se va dubla până în 2030, din cauza AI (IEA)
Consumul de energie electrică al centrelor de date urmează să se dubleze până la orizontul anilor 2030 din cauza necesarului în creștere legat de dezvoltarea inteligenței artificiale (AI), transmite într-un nou raport, publicat joi, Agenția Internațională pentru Energie (IEA), care semnalează noi provocări pentru securitatea energetică, dar și pentr
Compania Amazon amână lansarea primilor săi sateliți pentru internet din cauza condițiilor meteorologice
Lansarea primilor sateliți pentru internet de mare viteză ai companiei Amazon, pentru dezvoltarea unei rețele menite să concureze cu Starlink, a lui Elon Musk, a fost amânată din cauza condițiilor meteorologice nefavorabile, conform companiei United Launch Alliance (ULA) care organizează misiunea, transmite joi DPA. ''O nouă dată
Lună versus Marte: Alesul lui Trump la conducerea NASA se confruntă cu întrebări dificile despre viitorul agenției
Antreprenorul Jared Isaacman, nominalizat de președintele Donald Trump pentru a conduce NASA, va trebui să răspundă miercuri unor întrebări din partea senatorilor americani cu privire la modul în care va încerca să păstreze un echilibru între dorința administrației Trump de a trimite echipaje pe Marte și programul emblematic al agenției spațiale ameri
Astronomii au detectat două stele pitice albe menite să moară într-o detonare cvadruplă
Astronomii au detectat două stele pitice albe puternice - rămășițe stelare extrem de compacte - care orbitează aproape una de cealaltă și care par destinate să moară într-o detonare cvadruplă extraordinar de violentă, informează Reuters. Cele două stele, legate gravitațional una de cealaltă în ceea ce se numește 'sistem binar', au fost loca