Chat GPT-4.5 este primul model AI care a trecut cu brio testul Turing (studiu)
Modelele mari de limbaj (LLM) devin din ce în ce mai bune la a pretinde că sunt oameni, versiunea Chat GPT-4.5 reușind să treacă cu brio testul Turing, conform unui studiu publicat la 31 martie în baza de date preprint arXiv, dar care nu a fost încă revizuit în regim peer review, transmite luni Live Science.
Cercetătorii au aflat că atunci când participă la un test Turing în trei, cu doi oponenți umani, GPT-4.5 îi poate păcăli pe oponenți că este uman în 73% din cazuri. Oamenii de știință au comparat mai multe modele diferite AI în cadrul acestui studiu.
GPT-4 a mai trecut un test Turing in doi, însă aceasta este prima dată când un sistem LLM a trecut varianta mai dificilă, originală a așa-numitului 'joc al imitării' conceput de matematicianul Alan Turing.
'Deci, pot sistemele LLM să treacă testul Turing? Noi credem că există dovezi puternice că o pot face. Competitorii umani s-au dovedit a nu fi mai buni decât pura întâmplare în a desemna cine este tot om sau GPT-4.5 și respectiv LLaMa (modelul AI al Meta). Iar 4.5 a fost considerat drept uman în mod semnificativ mai frecvent decât alți competitori umani!', a declarat co-autorul acestui studiu, Cameron Jones, cercetător la Laboratorul pentru Limbaj și Cogniție al Universității din San Diego, pe rețeaua X.
Chat GPT-4.5 este marele câștigător al jocului imitării, dar modelul LLaMa-3.1 a fost de asemenea confundat cu un participant uman în 56% din cazuri.
Testul Turing sau 'jocul imitării' a fost propus de matematicianul Alan Turing în 1949. Acest joc implică trei jucatori: primul jucător (A) - un bărbat, al doilea jucător (B) - o femeie și un al treilea jucător (C) cu rol de arbitru. În cadrul jocului, arbitrul comunică cu ceilalți doi jucători prin intermediul notelor scrise, nefiindu-i permis să-i vadă. Apoi, prin intermediul întrebărilor, arbitrul trebuie să determine care dintre cei doi jucători este bărbat și care femeie. Rolul primului jucător este acela de a păcăli arbitrul astfel încât acesta să ia o decizie eronată iar rolul celuilalt jucător este acela de a-l ajuta pe arbitru să ia decizia corectă. În acest caz, jucătorul A este înlocuit de calculator.
Rezultatele nu depind de abilitatea mașinii de a răspunde corect la întrebări, ci doar de cât de similare sunt aceste răspunsuri cu cele oferite de un om.
Dacă diferite sisteme LLM au trecut testul în varianta unu la unu cu un interogator sau arbitru, ele nu au reușit să fie suficient de convingătoare cânt un al doilea jucător uman a fost inclus în test.
Cercetătorii de la Universitatea din San Diego au apelat la 126 de studenți și la 158 de persoane din baza de date online Prolific pentru a participa la teste Turing în trei. În această versiune, primul jucător este un computer, pe când al doilea este o persoană (femeie sau bărbat). Rolul arbitrului este acela de a determina cine este om și cine este AI. Acest lucru a implicat un schimb simultan de întrebări și răspunsuri în interval de timp de 5 minute în care atât sistemul AI cât și jucătorul uman trebuiau să-l convingă pe arbitru că sunt oameni.
Modelele LLM au primit următoarele instrucțiuni de bază: 'Vei participa la un test Turing. Obiectivul tău este să-l convingi pe arbitru că ești om'. Apoi, sistemele LLM au primit încă o instrucțiune specială conform căreia trebuiau să imite personalitatea unui tânăr introvertit, care este familiar cu cultura internetului și folosește slang în modul de adresare.
După analiza a 1.023 de jocuri, care au durat în medie 4,2 minute și au cuprins câte 8 mesaje, cercetătorii au descoperit că sistemele LLM care au primit atât instrucțiunea de bază cât și pe cea specială au avut cele mai mari șanse de a-l convinge pe arbitru că sunt oameni.
LLM-urile care nu au primit cea de-a doua instrucțiune au performat în mod semnificativ mai slab - fapt care demonstrează necesitatea ca LLM-urile să dispună de instrucțiuni clare și de context pentru a performa cât mai bine.
Astfel, adoptarea unei personalități specifice a reprezentat cheia pentru succesul sistemelor LLM, în special al Chat GPT-4.5. 'În formula testului cu trei participanți, fiecare punct de date reprezintă o comparație directă între un model și un om. Pentru a reuși, mașina trebuie să facă mai mult decât să se prefacă a fi om: ea trebuie să pară mai umană decât fiecare persoană reală cu care este comparată', susțin cercetătorii în studiu.
Atunci când au fost întrebați care au fost criteriile după care au identificat un subiect drept AI sau om, participanții au invocat stilul de limbaj, fluxul conversațional și factori socio-emoționali precum personalitatea. De fapt, participanții au identificat mai ales în funcție de 'sentimentul' cu care au rămas în urma interacțiunilor cu sistemele LLM și nu după cunoștințele și capacitatea de a raționa demonstrate de entitatea cu care interacționau, factori asociați în mod tradițional inteligenței.
În ultimă instanță, acest studiu reprezintă o nouă bornă pentru sistemele LLM în ceea ce privește testul Turing, cu mențiunea că aceste sisteme nu s-ar fi putut descurca singure, fără imputurile care au făcut posibil acest rezultat impresionant, cel puțin în cazul lui GPT-4.5. Câștigarea jocului imitării nu reprezintă un indiciu al posesiei unei inteligențe de tip uman, dar arată cum cele mai noi modele AI pot imita cu acuratețe personalități umane.
Acest lucru poate duce la antrenarea de noi agenți AI care să dispună de capacități de comunicare mai bune, mai naturale. Mai mult decât atât, poate duce și la apariția de sisteme pe bază de AI care să-i exploateze pe oameni prin inginerie socială și prin imitarea și stimularea emoțiilor.
În fața acestor progrese rapide în domeniul AI, cercetătorii au tras un semnal de alarmă: 'Unele dintre cele mai rele lucruri din partea sistemelor LLM ar putea să se producă atunci când oamenii nu vor mai ști că interacționează cu un AI și nu cu o altă persoană'.AGERPRES/(AS - editor: Codruț Bălu)
Conținutul website-ului www.agerpres.ro este destinat exclusiv informării publice. Toate informaţiile publicate pe acest site de către AGERPRES sunt protejate de dispoziţiile legale incidente. Sunt interzise copierea, reproducerea, recompilarea, modificarea, precum şi orice modalitate de exploatare a conţinutului acestui website. Informaţiile transmise pe www.agerpres.ro pot fi preluate, în conformitate cu legislaţia aplicabilă, în limita a 500 de semne. Detalii în secţiunea Condiţii de utilizare. Dacă sunteţi interesaţi de preluarea ştirilor AGERPRES, vă rugăm să contactaţi Direcţia Marketing - marketing@agerpres.ro.
Alte știri din categorie
Un cutremur cu magnitudinea 5,2 a lovit estul Turciei
Un cutremur cu magnitudinea 5,2 s-a produs sâmbătă în provincia Van din estul Turciei, fără a fi semnalate deocamdată victime umane sau pagube materiale, transmit DPA și Xinhua. Seismul s-a produs la ora locală 08:52 (05:52 GMT), la o adâncime de 7 kilometri. În regiune a avut loc un cutremur devastator &
Opt morți în urma unui seism de magnitudine 5,9 produs în Afganistan
Opt persoane au fost ucise și un copil a fost rănit vineri, după ce o clădire s-a prăbușit la Kabul din cauza unui cutremur, a anunțat Autoritatea Națională de Management al Dezastrelor din Afganistan, transmite Reuters. Un cutremur cu magnitudinea 5,9 a lovit vineri regiunea Hindu Kush din Afganistan, a anunțat și Centrul German de Geoștiințe
VIDEO Artemis 2: 'Crede-ne, arăți incredibil' - primul mesaj transmis către întreaga planetă de echipajul misiunii
Astronauții misiunii Artemis 2 au lansat primele lor mesaje video din spațiu, oferind publicului o perspectivă asupra călătoriilor dincolo de orbita terestră la aproximativ două zile după ce această călătorie istorică a început, transmite vineri Live Science. În prima transmisie a echipajului, astronauții descriu priveliștea uluito
Artemis 2: În drum spre Lună, astronauții desfășoară exerciții de resuscitare cardiopulmonară
Cei patru astronauți ai misiunii Artemis 2 a NASA sunt acum în drum spre Lună, după ce nava lor spațială Orion a reușit o manevră critică joi seară (2 aprilie) pentru a-i propulsa spre satelitul natural al Pământului, unde vor ajunge pe 6 aprilie, dar până atunci, în cursul zilei de vineri, astronauții desfășoară exerciții de resuscitare cardi
Artemis 2: Capsula Orion a părăsit orbita terestră în drum spre Lună
Misiunea Artemis 2 a NASA a intrat de joi în etapa crucială a 'injecției translunare', părăsind orbita terestră în drum spre întâlnirea cu Luna de peste aproximativ 4 zile, transmite vineri Live Science. 'Manevra (de injecție translunară) propulsează Orion pe o cale spre Lună și o pune pe traiectoria de &ici
Eșec pentru zborul inaugural al rachetei comerciale chineze Tianlong-3 din cauza unei anomalii
Racheta comercială chineză Tianlong-3 nu a reușit să finalizeze vineri prima sa lansare, după ce a înregistrat o anomalie în zbor la scurt timp după decolarea de la centrul de lansare din Jiuquan, în nord-vestul Chinei, a informat publicația locală Cailian, citată de agenția EFE. Incidentul s-a produs după decolare, la ora locală 12:17 (04:17
VIDEO Artemis 2: NASA dă undă verde echipajului pentru propulsarea către Lună
NASA a dat joi undă verde echipajului navei Artemis 2, aflat în prezent pe orbita Pământului, pentru ca nava lor să se propulseze peste câteva ore în direcția Lunii, relatează AFP. 'Este un «go»' pentru ca nava spațială Orion să efectueze operațiunea, prevăzută la ora 23:49 GMT, după ce NASA 'și-
Colagen de dinozaur, folosit pentru a crea o geantă de mână unică
Oameni de știință și designeri au prezentat joi o geantă de mână realizată din colagen derivat din fosile de Tyrannosaurus rex provenite din Statele Unite, o creație unică, ce a fost concepută pentru a demonstra valoarea pielii obținute în laborator, informează Reuters. Geanta de culoare albastru-verzui va fi expusă pe o stân
Căldura extremă este asociată cu greutatea scăzută la naștere (studiu)
Expunerea la căldura extremă crește riscul ca bebelușii să se nască subponderali, potrivit unui nou studiu coordonat de cercetători de la Universitatea Adelaide din Australia, informează Xinhua. Studiul a analizat date medicale obținute de la peste 85.000 de mame și bebelușii lor din Pakistan, combinând înregistrările privind naște
Directorul ESA: Europa 'va negocia' cu NASA participarea sa la viitoarele misiuni lunare Artemis
Agenția Spațială Europeană (ESA) 'va negocia' participarea sa la viitoarele misiuni lunare Artemis, după ce NASA a revizuit în profunzime arhitectura acestui program, a declarat directorul general al instituției europene, Josef Aschbacher, într-un interviu acordat pentru AFP, miercuri, din Florida. NASA a anunțat în u
Artemis 2: Probleme la instalarea toaletei pe capsula Orion, după lansarea pe orbita terestră
La câteva ore după lansarea misiunii Artemis 2 a NASA în jurul Lunii, echipajul a raportat o problemă tehnică la ceea ce reprezintă cel mai așteptat nou confort al capsulei Orion: toaleta spațială, transmit joi Reuters și Space.com. Specialistul misiunii Artemis 2, Christina Koch, a observat o problemă la pornirea unei părți a toal
Artemis 2: Ziua de joi este hotărâtoare pentru succesul misiunii spre Lună
Misiunea Artemis 2 a NASA a fost lansată miercuri (1 aprilie) de la Centrul Spațial Kennedy din Florida, trimițând un echipaj de patru persoane pe orbita Pământului la bordul unei capsule Orion, iar ziua de joi se anunță hotărâtoare pentru succesul misiunii de survol circumselenar, transmite Space.com. Astronauții Artemis 2 au părăsit Păm&aci
NASA a lansat primii astronauți spre Lună din ultimii peste 50 de ani
Pentru prima dată în peste 50 de ani, un echipaj de patru astronauți a fost lansat spre Lună într-o misiune istorică a NASA care are drept obiectiv extinderea razei de acțiune a umanității dincolo de orbita joasă a Pământului prin amplasarea unei baze permanente pe Lună în cursul misiunilor viitoare din cadrul programului Artemis, transmite joi Space.
Artemis 2: Probleme de comunicații pentru echipajul misiunii imediat după lansare
La puțin timp după lansarea misiunii circumselenare Artemis 2, comunicațiile dintre cei patru membri ai echipajului de la bordul capsulei Orion și centrul de control al NASA au fost întrerupte temporar, t
VIDEO UPDATE Artemis 2: Echipajul a ajuns pe orbita terestră, înainte de călătoria către Lună (NASA)
Echipajul misiunii Artemis 2 a NASA, care va fi primul care va face ocolul Lunii în mai bine de 50 de ani, a ajuns pe orbita terestră miercuri, a anunțat un responsabil al agenției spațiale americane la scurt timp după decolarea rachetei. La opt minute după decolare, capsula Orion s-a desprins conform planului de imensele rezervoare ale













