Chat GPT-4.5 este primul model AI care a trecut cu brio testul Turing (studiu)

Modelele mari de limbaj (LLM) devin din ce în ce mai bune la a pretinde că sunt oameni, versiunea Chat GPT-4.5 reușind să treacă cu brio testul Turing, conform unui studiu publicat la 31 martie în baza de date preprint arXiv, dar care nu a fost încă revizuit în regim peer review, transmite luni Live Science.
Cercetătorii au aflat că atunci când participă la un test Turing în trei, cu doi oponenți umani, GPT-4.5 îi poate păcăli pe oponenți că este uman în 73% din cazuri. Oamenii de știință au comparat mai multe modele diferite AI în cadrul acestui studiu.
GPT-4 a mai trecut un test Turing in doi, însă aceasta este prima dată când un sistem LLM a trecut varianta mai dificilă, originală a așa-numitului 'joc al imitării' conceput de matematicianul Alan Turing.
'Deci, pot sistemele LLM să treacă testul Turing? Noi credem că există dovezi puternice că o pot face. Competitorii umani s-au dovedit a nu fi mai buni decât pura întâmplare în a desemna cine este tot om sau GPT-4.5 și respectiv LLaMa (modelul AI al Meta). Iar 4.5 a fost considerat drept uman în mod semnificativ mai frecvent decât alți competitori umani!', a declarat co-autorul acestui studiu, Cameron Jones, cercetător la Laboratorul pentru Limbaj și Cogniție al Universității din San Diego, pe rețeaua X.
Chat GPT-4.5 este marele câștigător al jocului imitării, dar modelul LLaMa-3.1 a fost de asemenea confundat cu un participant uman în 56% din cazuri.
Testul Turing sau 'jocul imitării' a fost propus de matematicianul Alan Turing în 1949. Acest joc implică trei jucatori: primul jucător (A) - un bărbat, al doilea jucător (B) - o femeie și un al treilea jucător (C) cu rol de arbitru. În cadrul jocului, arbitrul comunică cu ceilalți doi jucători prin intermediul notelor scrise, nefiindu-i permis să-i vadă. Apoi, prin intermediul întrebărilor, arbitrul trebuie să determine care dintre cei doi jucători este bărbat și care femeie. Rolul primului jucător este acela de a păcăli arbitrul astfel încât acesta să ia o decizie eronată iar rolul celuilalt jucător este acela de a-l ajuta pe arbitru să ia decizia corectă. În acest caz, jucătorul A este înlocuit de calculator.
Rezultatele nu depind de abilitatea mașinii de a răspunde corect la întrebări, ci doar de cât de similare sunt aceste răspunsuri cu cele oferite de un om.
Dacă diferite sisteme LLM au trecut testul în varianta unu la unu cu un interogator sau arbitru, ele nu au reușit să fie suficient de convingătoare cânt un al doilea jucător uman a fost inclus în test.
Cercetătorii de la Universitatea din San Diego au apelat la 126 de studenți și la 158 de persoane din baza de date online Prolific pentru a participa la teste Turing în trei. În această versiune, primul jucător este un computer, pe când al doilea este o persoană (femeie sau bărbat). Rolul arbitrului este acela de a determina cine este om și cine este AI. Acest lucru a implicat un schimb simultan de întrebări și răspunsuri în interval de timp de 5 minute în care atât sistemul AI cât și jucătorul uman trebuiau să-l convingă pe arbitru că sunt oameni.
Modelele LLM au primit următoarele instrucțiuni de bază: 'Vei participa la un test Turing. Obiectivul tău este să-l convingi pe arbitru că ești om'. Apoi, sistemele LLM au primit încă o instrucțiune specială conform căreia trebuiau să imite personalitatea unui tânăr introvertit, care este familiar cu cultura internetului și folosește slang în modul de adresare.
După analiza a 1.023 de jocuri, care au durat în medie 4,2 minute și au cuprins câte 8 mesaje, cercetătorii au descoperit că sistemele LLM care au primit atât instrucțiunea de bază cât și pe cea specială au avut cele mai mari șanse de a-l convinge pe arbitru că sunt oameni.
LLM-urile care nu au primit cea de-a doua instrucțiune au performat în mod semnificativ mai slab - fapt care demonstrează necesitatea ca LLM-urile să dispună de instrucțiuni clare și de context pentru a performa cât mai bine.
Astfel, adoptarea unei personalități specifice a reprezentat cheia pentru succesul sistemelor LLM, în special al Chat GPT-4.5. 'În formula testului cu trei participanți, fiecare punct de date reprezintă o comparație directă între un model și un om. Pentru a reuși, mașina trebuie să facă mai mult decât să se prefacă a fi om: ea trebuie să pară mai umană decât fiecare persoană reală cu care este comparată', susțin cercetătorii în studiu.
Atunci când au fost întrebați care au fost criteriile după care au identificat un subiect drept AI sau om, participanții au invocat stilul de limbaj, fluxul conversațional și factori socio-emoționali precum personalitatea. De fapt, participanții au identificat mai ales în funcție de 'sentimentul' cu care au rămas în urma interacțiunilor cu sistemele LLM și nu după cunoștințele și capacitatea de a raționa demonstrate de entitatea cu care interacționau, factori asociați în mod tradițional inteligenței.
În ultimă instanță, acest studiu reprezintă o nouă bornă pentru sistemele LLM în ceea ce privește testul Turing, cu mențiunea că aceste sisteme nu s-ar fi putut descurca singure, fără imputurile care au făcut posibil acest rezultat impresionant, cel puțin în cazul lui GPT-4.5. Câștigarea jocului imitării nu reprezintă un indiciu al posesiei unei inteligențe de tip uman, dar arată cum cele mai noi modele AI pot imita cu acuratețe personalități umane.
Acest lucru poate duce la antrenarea de noi agenți AI care să dispună de capacități de comunicare mai bune, mai naturale. Mai mult decât atât, poate duce și la apariția de sisteme pe bază de AI care să-i exploateze pe oameni prin inginerie socială și prin imitarea și stimularea emoțiilor.
În fața acestor progrese rapide în domeniul AI, cercetătorii au tras un semnal de alarmă: 'Unele dintre cele mai rele lucruri din partea sistemelor LLM ar putea să se producă atunci când oamenii nu vor mai ști că interacționează cu un AI și nu cu o altă persoană'.AGERPRES/(AS - editor: Codruț Bălu)
Conținutul website-ului www.agerpres.ro este destinat exclusiv informării publice. Toate informaţiile publicate pe acest site de către AGERPRES sunt protejate de dispoziţiile legale incidente. Sunt interzise copierea, reproducerea, recompilarea, modificarea, precum şi orice modalitate de exploatare a conţinutului acestui website. Informaţiile transmise pe www.agerpres.ro pot fi preluate, în conformitate cu legislaţia aplicabilă, în limita a 500 de semne. Detalii în secţiunea Condiţii de utilizare. Dacă sunteţi interesaţi de preluarea ştirilor AGERPRES, vă rugăm să contactaţi Direcţia Marketing - [email protected].
Alte știri din categorie
Sute de specii rare din Australia, în pericol de extincție în lipsa unei protecții urgente a habitatului (studiu)
Peste 220 dintre speciile critic amenințate cu dispariția din Australia sunt în pericol de extincție din cauza habitatelor fragmentate și a protecției inadecvate, potrivit unui nou studiu publicat vineri de Griffith University, informează Xinhua. Cercetătorii au realizat prima evaluare națională a speciilor cu arii de răspândire extrem de reduse, m
Emiratele Arabe Unite/ Temperatură record pentru luna mai, de 50,4 grade Celsius
Emiratele Arabe Unite au anunțat vineri o temperatură record pentru luna mai, de 50,4 grade Celsius, cea mai ridicată înregistrată în ultimele două decenii în această țară petrolieră din Golf, informează AFP. 'Cea mai ridicată temperatură înregistrată astăzi în întreaga țară este de 50,4 grade Celsius la Al Shawame
Un seism de 6,3 a lovit insula indoneziană Sumatra
Un seism de magnitudine 6,3 a lovit vineri insula indoneziană Sumatra, conform unui anunț al Agenției de Meteorologie, Climatologie și Geofizică a țării (BMKG), transmite DPA. Conform BMKG, cutremurul s-a produs la o adâncime estimată de 10 kilometri la ora locală 03:00 (joi, ora 20:00 GMT). Centrul german pentru Geoștiinț
Dinții sensibili, o moștenire veche de 500 de milioane de ani (studiu)
De ce dinții umani sunt atât de sensibili la frig și la durere? Poate pentru că ei sunt moștenirea unor organe senzoriale care aveau, la origine, o cu totul altă funcție decât masticația, afirmă autorii unui studiu publicat miercuri în revista Nature, informează AFP. Originea exactă a dinților și funcția lor primitivă răm&aci
Astronauții care participă la misiunea Shenzhou-20 au finalizat prima lor ieșire extravehiculară
Echipajul care participă la misiunea Shenzhou-20 la bordul stației spațiale chinezești Tiangong ('Palatul Celest') au finalizat prima lor serie de activități extravehiculare desfășurate joi pe orbita Pământului, a anunțat Agenția spațială chineză pentru zboruri cu echipaj uman (CMSA), citată de Xinhua. Cei trei astronauți - Chen
Grecia: Cutremur cu magnitudinea 6 în largul insulei Creta
Un cutremur cu magnitudinea 6 s-a produs joi în largul coastei insulei Creta, în Grecia, a anunțat Centrul German de Cercetare pentru Geoștiințe (GFZ), relatează Reuters și DPA. Cutremurul a avut loc la o adâncime de 77 km (47,85 mile), potrivit centrului german. Anterior, GFZ informase că seismul a avut o magn
Inundații rapide au izolat orașe din interiorul Australiei; locuitorii s-au refugiat pe acoperișuri
Ploile puternice care au lovit regiunea de sud-est a Australiei au declanșat inundații rapide care au izolat miercuri orașe întregi, iar unii locuitori au fost nevoiți să se refugieze pe acoperișuri în timp ce autoritățile au emis rapid ordine de evacuare, transmite Reuters. Localitățile din regiunile Hunter și Mid North Coast din
Chiar și la 1,5 grade de încălzire, creșterea nivelului mării ar putea fi dramatică (studiu)
Creșterea nivelului mării va testa sever rezistența umanității până la sfârșitul secolului și mai departe, chiar dacă încălzirea globală nu depășește 1,5°C, au avertizat marți cercetători, relatează AFP. Rata de creștere a nivelului mării s-a dublat în trei decenii ajungând la 10 centimetri și, dacă tendința actuală continuă,
Un seism cu magnitudinea 6,6 s-a produs în largul coastelor din Papua Noua Guinee
Un cutremur de pământ cu magnitudinea 6,6 s-a produs marți în largul coastelor nordice din Papua Noua Guinee, a anunțat Serviciul de Prospectare Geologică al Statelor Unite (USGS), citat de AFP. Seismul s-a produs la adâncimea de 52,7 kilometri, la o distanță de aproximativ 117 kilometri de orașul Angoram. Centrul Național de A
Pakistan/ Canicula duce la închiderea anticipată a școlilor în Punjab
Creșterea temperaturilor în Punjab, cea mai populată provincie din Pakistan, a determinat marți guvernul acestei provincii să închidă toate școlile publice și private pentru vacanța de vară cu patru zile mai devreme decât era prevăzut, informează AFP. Ministrul Educației la nivel de provincie, Rana Sikander Hayat, a declarat că vacanța de var
China se pregătește să lanseze o sondă spațială într-o misiune care vizează un asteroid
China va lansa în curând prima sa misiune spațială ce vizează prelevarea unor eșantioane de materie de pe un asteroid situat în proximitatea Pământului, a raportat luni presa de stat chineză, citată de DPA. Sonda Tianwen-2 urmează să fie lansată de la Centrul Spațial Xichang din provincia Sichuan la sfârșitul luni
Mai multe seisme s-au produs pe insula elenă Evia, fiind afectate peste 50 de locuințe
Mai multe seisme cu magnitudine de până în 4,7 au lovit nordul insulei Evia, cea de-a doua cea mai mare insulă a arhipelagului elen, în ultimele 24 de ore, transmite luni DPA. Cutremurele au fost simțite până la Atena, la aproximativ 130 de kilometri distanță. Seismologii greci au anunțat că monitorizează
O nouă erupție a vulcanului Lewotobi Laki-Laki din Indonezia
Un vulcan din estul Indoneziei a intrat de luni în erupție aruncând nori de gaze și cenușă vulcanică până la altitudinea de 1 kilometru și determinând autoritățile să ridice nivelul de alrtă la maxim, transmite AFP. Muntele vulcanic Lewotobi Laki-Laki (1584 de metri înălțime) de pe insula turistică Flores a intrat
Cel puțin 27 de persoane au murit în statele americane Kentucky și Missouri din cauza furtunilor puternice
Furtunile puternice au provocat moartea a cel puțin 27 de persoane în statele americane Missouri și Kentucky, au anunțat sâmbătă autoritățile, informează DPA. În Kentucky s-au înregistrat cel puțin 18 decese, a anunțat pe rețeaua X guvernatorul Andy Beshear. Devastarea este cutremurătoare, a scris Beshear
Ninsoare rară în Letonia la sfârșit de primăvară
Ninsoarea care s-a abătut în noaptea de joi spre vineri asupra regiunii Vidzeme din nord-estul Letoniei este una dintre cele mai târzii ninsori de primăvară înregistrate vreodată în această țară, au anunțat meteorologii, informează Xinhua. Potrivit acestora, a fost raportată ninsoare vineri dimineață și în regiune