Chat GPT-4.5 este primul model AI care a trecut cu brio testul Turing (studiu)
Modelele mari de limbaj (LLM) devin din ce în ce mai bune la a pretinde că sunt oameni, versiunea Chat GPT-4.5 reușind să treacă cu brio testul Turing, conform unui studiu publicat la 31 martie în baza de date preprint arXiv, dar care nu a fost încă revizuit în regim peer review, transmite luni Live Science.
Cercetătorii au aflat că atunci când participă la un test Turing în trei, cu doi oponenți umani, GPT-4.5 îi poate păcăli pe oponenți că este uman în 73% din cazuri. Oamenii de știință au comparat mai multe modele diferite AI în cadrul acestui studiu.
GPT-4 a mai trecut un test Turing in doi, însă aceasta este prima dată când un sistem LLM a trecut varianta mai dificilă, originală a așa-numitului 'joc al imitării' conceput de matematicianul Alan Turing.
'Deci, pot sistemele LLM să treacă testul Turing? Noi credem că există dovezi puternice că o pot face. Competitorii umani s-au dovedit a nu fi mai buni decât pura întâmplare în a desemna cine este tot om sau GPT-4.5 și respectiv LLaMa (modelul AI al Meta). Iar 4.5 a fost considerat drept uman în mod semnificativ mai frecvent decât alți competitori umani!', a declarat co-autorul acestui studiu, Cameron Jones, cercetător la Laboratorul pentru Limbaj și Cogniție al Universității din San Diego, pe rețeaua X.
Chat GPT-4.5 este marele câștigător al jocului imitării, dar modelul LLaMa-3.1 a fost de asemenea confundat cu un participant uman în 56% din cazuri.
Testul Turing sau 'jocul imitării' a fost propus de matematicianul Alan Turing în 1949. Acest joc implică trei jucatori: primul jucător (A) - un bărbat, al doilea jucător (B) - o femeie și un al treilea jucător (C) cu rol de arbitru. În cadrul jocului, arbitrul comunică cu ceilalți doi jucători prin intermediul notelor scrise, nefiindu-i permis să-i vadă. Apoi, prin intermediul întrebărilor, arbitrul trebuie să determine care dintre cei doi jucători este bărbat și care femeie. Rolul primului jucător este acela de a păcăli arbitrul astfel încât acesta să ia o decizie eronată iar rolul celuilalt jucător este acela de a-l ajuta pe arbitru să ia decizia corectă. În acest caz, jucătorul A este înlocuit de calculator.
Rezultatele nu depind de abilitatea mașinii de a răspunde corect la întrebări, ci doar de cât de similare sunt aceste răspunsuri cu cele oferite de un om.
Dacă diferite sisteme LLM au trecut testul în varianta unu la unu cu un interogator sau arbitru, ele nu au reușit să fie suficient de convingătoare cânt un al doilea jucător uman a fost inclus în test.
Cercetătorii de la Universitatea din San Diego au apelat la 126 de studenți și la 158 de persoane din baza de date online Prolific pentru a participa la teste Turing în trei. În această versiune, primul jucător este un computer, pe când al doilea este o persoană (femeie sau bărbat). Rolul arbitrului este acela de a determina cine este om și cine este AI. Acest lucru a implicat un schimb simultan de întrebări și răspunsuri în interval de timp de 5 minute în care atât sistemul AI cât și jucătorul uman trebuiau să-l convingă pe arbitru că sunt oameni.
Modelele LLM au primit următoarele instrucțiuni de bază: 'Vei participa la un test Turing. Obiectivul tău este să-l convingi pe arbitru că ești om'. Apoi, sistemele LLM au primit încă o instrucțiune specială conform căreia trebuiau să imite personalitatea unui tânăr introvertit, care este familiar cu cultura internetului și folosește slang în modul de adresare.
După analiza a 1.023 de jocuri, care au durat în medie 4,2 minute și au cuprins câte 8 mesaje, cercetătorii au descoperit că sistemele LLM care au primit atât instrucțiunea de bază cât și pe cea specială au avut cele mai mari șanse de a-l convinge pe arbitru că sunt oameni.
LLM-urile care nu au primit cea de-a doua instrucțiune au performat în mod semnificativ mai slab - fapt care demonstrează necesitatea ca LLM-urile să dispună de instrucțiuni clare și de context pentru a performa cât mai bine.
Astfel, adoptarea unei personalități specifice a reprezentat cheia pentru succesul sistemelor LLM, în special al Chat GPT-4.5. 'În formula testului cu trei participanți, fiecare punct de date reprezintă o comparație directă între un model și un om. Pentru a reuși, mașina trebuie să facă mai mult decât să se prefacă a fi om: ea trebuie să pară mai umană decât fiecare persoană reală cu care este comparată', susțin cercetătorii în studiu.
Atunci când au fost întrebați care au fost criteriile după care au identificat un subiect drept AI sau om, participanții au invocat stilul de limbaj, fluxul conversațional și factori socio-emoționali precum personalitatea. De fapt, participanții au identificat mai ales în funcție de 'sentimentul' cu care au rămas în urma interacțiunilor cu sistemele LLM și nu după cunoștințele și capacitatea de a raționa demonstrate de entitatea cu care interacționau, factori asociați în mod tradițional inteligenței.
În ultimă instanță, acest studiu reprezintă o nouă bornă pentru sistemele LLM în ceea ce privește testul Turing, cu mențiunea că aceste sisteme nu s-ar fi putut descurca singure, fără imputurile care au făcut posibil acest rezultat impresionant, cel puțin în cazul lui GPT-4.5. Câștigarea jocului imitării nu reprezintă un indiciu al posesiei unei inteligențe de tip uman, dar arată cum cele mai noi modele AI pot imita cu acuratețe personalități umane.
Acest lucru poate duce la antrenarea de noi agenți AI care să dispună de capacități de comunicare mai bune, mai naturale. Mai mult decât atât, poate duce și la apariția de sisteme pe bază de AI care să-i exploateze pe oameni prin inginerie socială și prin imitarea și stimularea emoțiilor.
În fața acestor progrese rapide în domeniul AI, cercetătorii au tras un semnal de alarmă: 'Unele dintre cele mai rele lucruri din partea sistemelor LLM ar putea să se producă atunci când oamenii nu vor mai ști că interacționează cu un AI și nu cu o altă persoană'.AGERPRES/(AS - editor: Codruț Bălu)
Conținutul website-ului www.agerpres.ro este destinat exclusiv informării publice. Toate informaţiile publicate pe acest site de către AGERPRES sunt protejate de dispoziţiile legale incidente. Sunt interzise copierea, reproducerea, recompilarea, modificarea, precum şi orice modalitate de exploatare a conţinutului acestui website. Informaţiile transmise pe www.agerpres.ro pot fi preluate, în conformitate cu legislaţia aplicabilă, în limita a 500 de semne. Detalii în secţiunea Condiţii de utilizare. Dacă sunteţi interesaţi de preluarea ştirilor AGERPRES, vă rugăm să contactaţi Direcţia Marketing - marketing@agerpres.ro.
Alte știri din categorie
NASA a anunțat că racheta misiunii Artemis 2 este gata de lansare
Echipa misiunii Artemis 2 s-a reunit în ultimele două zile pentru a revizui pregătirea pentru zbor (FRR) a misiunii, înainte de a readuce racheta Space Launch System (SLS) și capsula Orion la rampa de lansare, după finalizarea reparațiilor necesare în Clădirea de Asamblare a Vehiculelor (VAB) de la Centrul Spațial Kennedy (KSC) al NASA din Florida,
Coliziunea dintre două planete îndepărtate, observată de astronomi, poate oferi informații despre formarea Lunii
Astronomii cred că au asistat la un eveniment cosmic observat extrem de rar în astronomie, ciocnirea dintre două planete telurice pe orbita unei stele îndepărtate, eveniment care poate oferi noi indicii cu privire la modul la care s-a format Luna pe orbita Pământului, transmite vineri Live Science care citează un studiu publicat pe 11 martie î
Turcia: Cutremur cu magnitudinea 5,5 în nord-estul țării
Un cutremur cu magnitudinea de 5,5 grade a lovit provincia Tokat din nord-estul Turciei, a anunțat vineri Agenția turcă pentru gestionarea dezastrelor (AFAD), notează AFP. 'În urma cutremurului cu magnitudinea de 5,5 grade care a avut loc la ora 03:35 (00:35 GMT) în districtul Niksar din provincia Tokat și care a fost resimțit
Corbii sunt mai inteligenți decât se credea și memorează teritoriile de vânătoare ale prădătorilor (studiu)
Se știa deja că sunt inteligenți, dar nu într-o astfel de măsură: corbii, care sunt necrofagi oportuniști, nu se mulțumesc doar să-i urmeze pe prădători, ci cartografiază și memorează totodată locurile în care prada este atacată, a dezvăluit joi o echipă internațională de cercetători, informează AFP.
O tibie de mari dimensiuni, descoperită în New Mexico, aparține unei rude a lui T-rex (studiu)
O nouă analiză efectuată recent asupra unei tibii de mari dimensiuni descoperite într-un loc izolat din nord-vestul statului american New Mexico în anii 1970 arată că osul în cauză aparține unei rude apropiate a lui Tyrannosaurus rex (T-rex), care a precedat acel dinozaur carnivor uriaș cu câteva milioane de ani și care ar fi putut fi un strămoș direc
În pofida reputației lor pacifiste, maimuțele bonobo sunt agresive, în special față de masculi (studiu)
Deși au reputația unor animale altruiste și pacifiste, maimuțele bonobo, considerate 'verișori' ai oamenilor, sunt la fel de agresive ca cimpanzeii, însă agresivitatea lor îi vizează în principal pe masculi, potrivit unui studiu publicat miercuri, relatează AFP. Trăind în societăți matriarhale, aceste maimuțe antropoide cu privi
COP31:Turcia dorește o conferință de 'implementare' a deciziilor
Turcia, care va prezida COP31 pentru schimbări climatice în Antalya, în luna noiembrie, dorește să facă din acest eveniment 'o conferință de implementare' a deciziilor, a declarat joi ministrul turc al Mediului, Murat Kurum, citat de AFP. 'Luăm decizii în mod constant în timpul reuniunilor Conferinței părților (COP), dar con
O cometă nou descoperită, care trece pe lângă Soare, va fi vizibilă pe cerul zilei în aprilie
O cometă nou descoperită, aflată în trecere pe lângă Soare, ar putea deveni vizibilă la începutul lunii aprilie, dacă va supraviețui trecerii prin proximitatea solară, transmite joi Space.com. Cometa C/2026 A1 (MAPS) a fost descoperită fotografic pe 13 ianuarie la observatorul AMACS1 din San Pedro de Atacama, Chile, de către patru astronomi f
Spania / Perioada ianuarie-februarie, ''cea mai ploioasă'' în aproape o jumătate de secol
Spania s-a confruntat anul acesta cu ''cea mai ploioasă'' perioadă ianuarie-februarie în aproape 50 de ani, marcată în special de inundații devastatoare în numeroase regiuni, a anunțat joi Agenția meteorologică națională (AEMET), informează AFP. Spania se află de mai mulți ani în prima linie a dereglărilor climatice &ici
Modelele AI pot oferi sfaturi medicale dezastruoase (studii)
Chatboții populari cu inteligență artificială adesea nu reușesc să distingă afirmațiile false despre sănătate atunci când acestea sunt transmise într-un limbaj sigur, cu tentă medicală, ceea ce duce la sfaturi dubioase care ar putea fi periculoase pentru publicul larg, potrivit unui studiu din ianuarie publicat în revista The Lancet Digital Health,
SpaceX este 'la aproximativ 4 săptămâni' de lansarea celei mai puternice variante Starship (Elon Musk)
Prima lansare a versiunii îmbunătățite a rachetei Starship va avea loc peste aproximativ o lună, a anunțat șeful SpaceX, Elon Musk, într-o postare pe platforma sa de socializare, X, transmite miercuri Space.com. Compania SpaceX pregătește 'Version 3' a Starship de mai mult timp și are în vedere lansarea sa la începutul lunii apr
Cometa interstelară 3I/ATLAS este neobișnuit de bogată în alcool, conform unui nou studiu
Astronomii care studiază cometa interstelară 3I/ATLAS au descoperit că acest obiect cosmic este neobișnuit de bogat în alcool, un indiciu chimic care poate dezvălui modul în care astfel de obiecte și chiar planete se pot forma pe orbitele unor stele, conform unui studiu încărcat în arhiva preprint arXiv, care nu a fost încă verificat în si
A fost identificată o bacterie din intestinul uman capabilă să îmbunătățească forța musculară (studiu)
Cercetătorii au identificat în intestinul uman o bacterie care poate să îmbunătățească forța musculară, o descoperire ce ar putea conduce la crearea unui probiotic pentru uz personal care să ajute la menținerea forței și a formei fizice odată cu înaintarea în vârstă, transmite miercuri EFE. Oamenii de știință de l
Întârzierile acumulate în dezvoltarea rachetei Starship a companiei SpaceX periclitează calendarul prevăzut de NASA pentru aselenizare
Racheta Starship a companiei SpaceX a acumulat întârzieri de cel puțin doi ani în etapa sa de dezvoltare de când NASA a ales această rachetă în 2021 pentru a transporta un modul lunar cu astronauți, iar specialiștii americani se așteaptă ca acest vehicul spațial să aibă nevoie de și mai mult timp pentru a depăși obstacolele tehnice rămas
Fondatorii producătorului german de vaccinuri BioNTech demisionează și vor conduce o nouă companie
Fondatorii producătorului german de vaccinuri BioNTech, devenit faimos în lumea întreagă datorită vaccinului său împotriva COVID-19, vor demisiona pentru a începe o nouă afacere, a transmis marți compania germană, citată de DPA. Ugur Sahin și Ozlem Tureci vor părăsi BioNTech cel mai târziu până la sfârșitul anului 2026












