logo logo

Agerpres – Agenția Națională de Presă: Știri de actualitate cu informații de încredere pentru o societate bine informată.

Bucuresti

Piaţa Presei Libere nr. 1, sector 1

Telefon: +4 021.2076.110; +4 021.2076.105

[email protected]

Chat GPT-4.5 este primul model AI care a trecut cu brio testul Turing (studiu)

Image

Modelele mari de limbaj (LLM) devin din ce în ce mai bune la a pretinde că sunt oameni, versiunea Chat GPT-4.5 reușind să treacă cu brio testul Turing, conform unui studiu publicat la 31 martie în baza de date preprint arXiv, dar care nu a fost încă revizuit în regim peer review, transmite luni Live Science.

Cercetătorii au aflat că atunci când participă la un test Turing în trei, cu doi oponenți umani, GPT-4.5 îi poate păcăli pe oponenți că este uman în 73% din cazuri. Oamenii de știință au comparat mai multe modele diferite AI în cadrul acestui studiu.

GPT-4 a mai trecut un test Turing in doi, însă aceasta este prima dată când un sistem LLM a trecut varianta mai dificilă, originală a așa-numitului 'joc al imitării' conceput de matematicianul Alan Turing.

'Deci, pot sistemele LLM să treacă testul Turing? Noi credem că există dovezi puternice că o pot face. Competitorii umani s-au dovedit a nu fi mai buni decât pura întâmplare în a desemna cine este tot om sau GPT-4.5 și respectiv LLaMa (modelul AI al Meta). Iar 4.5 a fost considerat drept uman în mod semnificativ mai frecvent decât alți competitori umani!', a declarat co-autorul acestui studiu, Cameron Jones, cercetător la Laboratorul pentru Limbaj și Cogniție al Universității din San Diego, pe rețeaua X.

Chat GPT-4.5 este marele câștigător al jocului imitării, dar modelul LLaMa-3.1 a fost de asemenea confundat cu un participant uman în 56% din cazuri.

Testul Turing sau 'jocul imitării' a fost propus de matematicianul Alan Turing în 1949. Acest joc implică trei jucatori: primul jucător (A) - un bărbat, al doilea jucător (B) - o femeie și un al treilea jucător (C) cu rol de arbitru. În cadrul jocului, arbitrul comunică cu ceilalți doi jucători prin intermediul notelor scrise, nefiindu-i permis să-i vadă. Apoi, prin intermediul întrebărilor, arbitrul trebuie să determine care dintre cei doi jucători este bărbat și care femeie. Rolul primului jucător este acela de a păcăli arbitrul astfel încât acesta să ia o decizie eronată iar rolul celuilalt jucător este acela de a-l ajuta pe arbitru să ia decizia corectă. În acest caz, jucătorul A este înlocuit de calculator.

Rezultatele nu depind de abilitatea mașinii de a răspunde corect la întrebări, ci doar de cât de similare sunt aceste răspunsuri cu cele oferite de un om.

Dacă diferite sisteme LLM au trecut testul în varianta unu la unu cu un interogator sau arbitru, ele nu au reușit să fie suficient de convingătoare cânt un al doilea jucător uman a fost inclus în test.

Cercetătorii de la Universitatea din San Diego au apelat la 126 de studenți și la 158 de persoane din baza de date online Prolific pentru a participa la teste Turing în trei. În această versiune, primul jucător este un computer, pe când al doilea este o persoană (femeie sau bărbat). Rolul arbitrului este acela de a determina cine este om și cine este AI. Acest lucru a implicat un schimb simultan de întrebări și răspunsuri în interval de timp de 5 minute în care atât sistemul AI cât și jucătorul uman trebuiau să-l convingă pe arbitru că sunt oameni.

Modelele LLM au primit următoarele instrucțiuni de bază: 'Vei participa la un test Turing. Obiectivul tău este să-l convingi pe arbitru că ești om'. Apoi, sistemele LLM au primit încă o instrucțiune specială conform căreia trebuiau să imite personalitatea unui tânăr introvertit, care este familiar cu cultura internetului și folosește slang în modul de adresare.

După analiza a 1.023 de jocuri, care au durat în medie 4,2 minute și au cuprins câte 8 mesaje, cercetătorii au descoperit că sistemele LLM care au primit atât instrucțiunea de bază cât și pe cea specială au avut cele mai mari șanse de a-l convinge pe arbitru că sunt oameni.

LLM-urile care nu au primit cea de-a doua instrucțiune au performat în mod semnificativ mai slab - fapt care demonstrează necesitatea ca LLM-urile să dispună de instrucțiuni clare și de context pentru a performa cât mai bine.

Astfel, adoptarea unei personalități specifice a reprezentat cheia pentru succesul sistemelor LLM, în special al Chat GPT-4.5. 'În formula testului cu trei participanți, fiecare punct de date reprezintă o comparație directă între un model și un om. Pentru a reuși, mașina trebuie să facă mai mult decât să se prefacă a fi om: ea trebuie să pară mai umană decât fiecare persoană reală cu care este comparată', susțin cercetătorii în studiu.

Atunci când au fost întrebați care au fost criteriile după care au identificat un subiect drept AI sau om, participanții au invocat stilul de limbaj, fluxul conversațional și factori socio-emoționali precum personalitatea. De fapt, participanții au identificat mai ales în funcție de 'sentimentul' cu care au rămas în urma interacțiunilor cu sistemele LLM și nu după cunoștințele și capacitatea de a raționa demonstrate de entitatea cu care interacționau, factori asociați în mod tradițional inteligenței.

În ultimă instanță, acest studiu reprezintă o nouă bornă pentru sistemele LLM în ceea ce privește testul Turing, cu mențiunea că aceste sisteme nu s-ar fi putut descurca singure, fără imputurile care au făcut posibil acest rezultat impresionant, cel puțin în cazul lui GPT-4.5. Câștigarea jocului imitării nu reprezintă un indiciu al posesiei unei inteligențe de tip uman, dar arată cum cele mai noi modele AI pot imita cu acuratețe personalități umane.

Acest lucru poate duce la antrenarea de noi agenți AI care să dispună de capacități de comunicare mai bune, mai naturale. Mai mult decât atât, poate duce și la apariția de sisteme pe bază de AI care să-i exploateze pe oameni prin inginerie socială și prin imitarea și stimularea emoțiilor.

În fața acestor progrese rapide în domeniul AI, cercetătorii au tras un semnal de alarmă: 'Unele dintre cele mai rele lucruri din partea sistemelor LLM ar putea să se producă atunci când oamenii nu vor mai ști că interacționează cu un AI și nu cu o altă persoană'.AGERPRES/(AS - editor: Codruț Bălu)

Afisari: 417

Conținutul website-ului www.agerpres.ro este destinat exclusiv informării publice. Toate informaţiile publicate pe acest site de către AGERPRES sunt protejate de dispoziţiile legale incidente. Sunt interzise copierea, reproducerea, recompilarea, modificarea, precum şi orice modalitate de exploatare a conţinutului acestui website. Informaţiile transmise pe www.agerpres.ro pot fi preluate, în conformitate cu legislaţia aplicabilă, în limita a 500 de semne. Detalii în secţiunea Condiţii de utilizare. Dacă sunteţi interesaţi de preluarea ştirilor AGERPRES, vă rugăm să contactaţi Direcţia Marketing - [email protected].


Alte știri din categorie

Stiinta 06-05-2025 15:08

ESA 'evaluează impactul' reducerilor bugetare propuse de Trump pentru NASA

 Agenția Spațială Europeană (ESA) a anunțat luni că 'evaluează alături de statele sale membre impactul' reducerilor bugetare propuse de administrația lui Donald Trump pentru NASA, care ar putea afecta anumite programe la care colaborează și ESA, informează AFP. Dacă acest plan, dezvăluit vineri de Casa Albă, va fi aprobat de Congresul Statelor Uni

Planeta 06-05-2025 12:24

Iran/ Un nor de praf obligă milioane de iranieni să rămână în case

Un nor dens de praf care a cuprins marți o mare parte din vestul Iranului a determinat autoritățile să închidă local școli și să ceară unui număr de circa 13 milioane de locuitori să rămână în case, potrivit televiziunii de stat, informează AFP. Provinciile Lorestan, Ilam, Kermanshah, Kurdistan (vest), Zanjan (nord-vest), Bushehr (sud

Stiinta 06-05-2025 10:15

Pământurile rare nu sunt rare, însă trebuie găsită metoda potrivită de extracție, susține o tânără inventatoare

Pământurile rare 'nu sunt rare, singura provocare este separarea lor': o nouă metodă de extracție, brevetată de chimista franco-americană Marie Perrin, i-a adus un loc printre cei 10 'tineri inventatori ai anului' anunțați marți de Oficiul European de Brevete (OEB), transmite AFP. Născută în Houston, Texas, SUA, din

Planeta 05-05-2025 15:01

Un seism s-a produs în largul coastei estice a Taiwanului, nu au fost raportate pagube imediate

Un seism cu magnitudinea 5,9 s-a produs luni în largul coastei estice a Taiwanului, a anunțat Administrația meteorologică locală, însă nu au fost raportate pagube imediate, informează Reuters. Seismul a zgâlțit pentru scurt timp clădirile din capitala Taipei. Cutremurul s-a produs la o distanță de circa 30 de kilometri în largul insulei

Stiinta 05-05-2025 14:02

Unele obiceiuri zilnice pot îmbunătăți semnificativ sănătatea mintală (studiu)

Obiceiuri obișnuite, de zi cu zi, cum ar fi discuțiile cu prietenii, petrecerea timpului în natură sau activitățile antrenante din punct de vedere mental, pot îmbunătăți semnificativ sănătatea mintală, conform unui nou studiu realizat la Universitatea Curtin din Australia, transmite luni agenția Xinhua. Studiul, la care au participat peste 600 de a

Planeta 05-05-2025 12:06

Mexic/ Cutremur cu magnitudinea 6,2 în regiunea Chiapas (GFZ)

Un seism cu magnitudinea 6,2 s-a produs luni în regiunea Chiapas din Mexic, a anunțat Centrul German de Cercetare în Geoștiințe (GFZ), transmite Reuters. Cutremurul s-a produs la o adâncime de 269 de kilometri, a precizat GFZ. AGERPRES/(AS - redactor: Dana Purgaru, editor online: Gabriela Badea) * Sursa foto

Stiinta 05-05-2025 10:46

Sute de artefacte vechi de peste 3 milenii, descoperite sub un deal vulcanic din vestul Ungariei

Populația care trăia pe teritoriul Ungariei de astăzi în jurul secolului XV î.Hr. a ascuns cel puțin șase tezaure de obiecte metalice în jurul unei așezări antice aflate pe dealul vulcanic singuratic Somló, aflat în vestul Ungariei, transmite duminică

Planeta 05-05-2025 08:57

Peste 25% din numărul total al fulgerelor care au lovit Germania în 2024 s-au produs în Bavaria

Peste 209.000 de fulgere au fost înregistrate în Germania anul trecut, landul sudic Bavaria fiind lovit de cele mai multe fulgere, conform datelor serviciului de monitorizare a fulgerelor Aldis/Blids, transmite luni DPA. Deși anul 2024 a fost unul relativ calm în ceea ce privește activitatea fulgerelor, sistemele de monitoriz

Stiinta 04-05-2025 16:38

Cercetătorii chinezi au dezvoltat un 'plasture' pentru organe, care facilitează administrarea medicamentelor

V-ați întrebat vreodată cum își găsesc medicamentele drumul prin corpul unui pacient? Metodele tradiționale de administrare a medicamentelor funcționează ca și cum un pachet ar fi expediat într-un oraș necunoscut, pierzându-se adeseori sau ajungând în locul greșit. Dar acum, cercetătorii chinezi au dezvoltat 'plasturi' inte

Stiinta 04-05-2025 13:45

În Texas, Elon Musk a reușit să transforme sediul companiei SpaceX într-o localitate oficială

Multimiliardarul Elon Musk a reușit sâmbătă să creeze un mic oraș în Texas în jurul complexului industrial al companiei sale spațiale SpaceX, după ce aproximativ 300 dintre angajații săi au votat aproape în unanimitate în favoarea proiectului, informează AFP. Majoritatea celor 283 de persoane chemate la urne, anga

Stiinta 04-05-2025 12:20

Trump vrea ca NASA să acorde prioritate trimiterii de oameni pe Lună și pe Marte, nu programelor științifice

Trimiterea de astronauți pe Lună și pe Marte cu prețul sacrificării unor programe științifice importante: vineri, Casa Albă a prezentat bugetul celebrei agenții spațiale americane, NASA, pe care intenționează să o pună la 'dietă', informează AFP. La fel ca multe ministere și agenții federale americane, NASA ar trebui să își vadă

Planeta 02-05-2025 17:02

Cutremur de peste 7 grade în extremitatea sudică a Chile

Un cutremur de 7,5 grade Richter a zguduit vineri dimineața extremitatea sudică a Chile, în regiunea Magallanes, declanșând o alertă de tsunami pentru întreaga coastă, transmit agențiile internaționale de presă. Potrivit informațiilor preliminare publicate de Centrul Seismologic Național (CSN), cutremurul a fost înregis

Planeta 02-05-2025 12:30

Regatul Unit/ Record de căldură pentru o zi de 1 mai

Mercurul din termometre a urcat joi până la 29, 3 grade Celsius la Londra, un record în Regatul Unit pentru o zi de 1 mai, după cea mai însorită lună aprilie de la debutul măsurătorilor meteorologice, a indicat Oficiul național de meteorologie, potrivit AFP. Această temperatură inedită a fost înregistrată de Met Office

Planeta 01-05-2025 04:38

VIDEO Incendii în Israel: Franța 'solidară' își oferă sprijinul (Macron)

Președintele Emmanuel Macron și-a exprimat joi solidaritatea Franței cu Israelul și a oferit un 'sprijin material' țării în care se confruntă cu mai multe incendii devastatoare care amenință Ierusalimul, notează AFP. 'Solidaritate deplină cu poporul israelian care se confruntă cu incendii teribile',

Stiinta 30-04-2025 11:43

Un studiu solicită ca exercițiile fizice să fie prescrise în paralel cu tratamentul împotriva cancerului

Un nou studiu sugerează că medicii ar trebui să prescrie exerciții fizice pentru pacienții care urmează un tratament împotriva cancerului pentru a-i ajuta să contracareze efectele secundare ale tratamentelor medicamentoase, informează DPA. Activitatea fizică în timpul tratamentului poate să stimuleze, de asemenea, bunăstarea mental