Cercetătorii au apelat la popularul joc Dungeons & Dragons pentru a afla dacă AI-ul și oamenii pot colabora
Modele de inteligență artificială (AI) au jucat popularul joc de roluri Dungeons & Dragons (D&D), împreună cu jucători umani astfel încât cercetătorii să le poată testa capacitatea de a crea strategii pe termen lung și de a colabora atât cu alte sisteme AI, cât și cu oameni, conform unui studiu prezentat la conferința NeurIPS 2025, care a avut loc între 2 și 7 decembrie la San Diego, transmite vineri Live Science.
Oamenii de știință au susținut că jocul D&D este un banc de testare optim datorită unui melanj unic de creativitate și reguli rigide care poate evidenția capacitatea AI de a rezolva probleme complexe și de a colabora cu oamenii.
Pentru a avea succes în joc, modelele AI trebuie să demonstreze capacitatea de a planifica, de a comunica și de a-și aminti, precum și de a demonstra conștientizarea tacticilor și intențiilor adversarilor. D&D oferă un context în care cadrul și regulile sunt clar definite și acționează ca o punte între limbajul natural și mecanica jocului.
Pentru experimente, un singur model ar putea să-și asume rolul de Dungeon Master (DM) - persoana care creează povestea, decide misiunile, plasează monștrii și hotărește recompensele - precum și un erou (au fost câte un DM și patru eroi în fiecare scenariu). În cadrul construit pentru studiu, numit D&D Agents, modelele pot juca și cu alte LLM-uri (Large Language Models - modele mari de limbaj AI) și cu jucătorii umani. De exemplu, un LLM ar putea să-și asume rolul de DM, în timp ce două modele AI și doi jucători umani au jucat cu eroii.
'Dungeons & Dragons este un teren natural de testare pentru a evalua planificarea în mai multe etape, respectarea regulilor și a strategiei echipei', a declarat într-un comunicat autorul principal al studiului, Raj Ammanabrolu, profesor asistent la Universitatea din California, San Diego, Departamentul de Informatică și Inginerie. 'Deoarece jocul se desfășoară prin dialog, D&D deschide, de asemenea, o cale directă pentru interacțiunea om-AI: modelele pot asista sau pot juca împreună cu alte persoane umane'.
Simularea nu reproduce o întreagă campanie D&D ci se concentrează, în schimb, pe întâlniri de luptă, extrase dintr-o aventură pre-scrisă numită 'Lost Mine of Phandelver'. Pentru a crea parametrii unui test, echipa a ales unul dintre cele trei scenarii de luptă din aventură, un set de patru personaje și nivelurile de putere ale personajelor (scăzut, mediu sau ridicat). Fiecare episod a durat 10 ture, apoi au fost analizate rezultatele.
Cercetătorii au rulat trei modele AI diferite prin simulare - DeepSeek-V3, Claude Haiku 3.5 și GPT-4 - și au folosit D&D ca instrument de evaluare pentru modul în care modelele au demonstrat capacitățile de planificare pe termen mediu și lung și de utilizare a instrumentelor, printre alte calități. Acestea sunt atribute cheie pentru aplicațiile din lumea reală, cum ar fi optimizarea lanțului de aprovizionare sau crearea liniilor de producție. Ei au testat, de asemenea, cât de bine s-ar putea coordona și planifica împreună modelele, ceea ce s-ar aplica scenariilor precum modelarea răspunsului la dezastre sau în sistemele multi-agent de căutare și salvare.
În general, modelul Claude Haiku 3.5 a demonstrat cea mai bună eficiență în luptă, în special în scenariile mai dificile. În scenariile mai simple, conservarea resurselor a fost destul de similară în toate cele trei modele. În D&D, resursele sunt lucruri precum numărul de vrăji sau abilități pe care un personaj le poate folosi în fiecare zi sau numărul de poțiuni de vindecare disponibile. Deoarece acestea erau scenarii de luptă izolate, a existat puține stimulente pentru a economisi resurse pentru mai târziu, așa cum ați putea face dacă jucați o aventură completă.
În situații mai dificile, Claude Haiku 3.5 a arătat mai multă disponibilitate de a folosi mai multe resurse alocate, ceea ce a condus la rezultate mai bune. GPT-4 l-a urmat îndeaproape, iar DeepSeek-V3 a întâmpinat cele mai multe probleme.
Cercetătorii au evaluat, de asemenea, cât de bine ar putea modelele să rămână în personaj pe toată durata simulării. Ei au creat un instrument de evaluare denumit Acting Quality care a izolat discursul narativ al modelelor (generat ca răspunsuri text) și a analizat cât de bine modelele au rămas în personaj și în funcție de vocile folosite.
Ei au descoperit că DeepSeek-V3 a generat o mulțime de îndemnuri de luptă și a lansat 'batjocuri' la adresa oponenților, dar că deseori a reutilizat aceleași voci. Claude Haiku 3.5, pe de altă parte, și-a adaptat dicția mai specific la clasa sau monstrul pe care îl juca, fie că era un Paladin Sfânt sau un druid iubitor de natură. GPT-4, între timp, a căzut undeva la mijloc, producând un amestec de narațiune în caracter și frazare meta-tactică.
Unele dintre cele mai interesante și idiosincratice strigăte de luptă au venit atunci când modelele jucau rolul monștrilor. Diferitele creaturi au început să-și dezvolte personalități distincte, ceea ce a dus la goblinii care țipau în mijlocul bătăliei: 'Heh, omul strălucitor va sângera!'
Cercetătorii au spus că acest tip de cadru de testare este important pentru a evalua cât de bine pot funcționa modelele AI fără aport uman pentru perioade lungi. Este o măsură a capacității unei AI de a acționa independent, rămânând în același timp coerentă și previzibilă - o capacitate care necesită memorie și gândire strategică.
În viitor, echipa speră să implementeze campanii complete de D&D care să modeleze toată narațiunea și acțiunea în afara luptei, subliniind și mai mult creativitatea și capacitatea AI de a improviza ca răspuns la contribuțiile oamenilor sau ale altor modele LLM.AGERPRES/(AS - editor: Codruț Bălu, editor online: Ada Vîlceanu)
Conținutul website-ului www.agerpres.ro este destinat exclusiv informării publice. Toate informaţiile publicate pe acest site de către AGERPRES sunt protejate de dispoziţiile legale incidente. Sunt interzise copierea, reproducerea, recompilarea, modificarea, precum şi orice modalitate de exploatare a conţinutului acestui website. Informaţiile transmise pe www.agerpres.ro pot fi preluate, în conformitate cu legislaţia aplicabilă, în limita a 500 de semne. Detalii în secţiunea Condiţii de utilizare. Dacă sunteţi interesaţi de preluarea ştirilor AGERPRES, vă rugăm să contactaţi Direcţia Marketing - marketing@agerpres.ro.
Alte știri din categorie
Cutremure în Venezuela/ Cel puțin 164 de morți și aproape 1.000 de răniți (bilanț provizoriu)
Președintele interimar al Venezuelei, Delcy Rodriguez, a anunțat joi că cel puțin 164 de persoane și-au pierdut viața și alte aproape 1.000 au fost rănite în urma a două seisme cu magnitudinea 7,2
Piețe, bulevarde și mașini, transformate în dormitoare improvizate după cutremurele din Venezuela
Venezuelenii au dormit pe saltele și rogojini întinse pe asfalt sau s-au refugiat în propriile lor autoturisme parcate pe străzi joi dimineață devreme, pe fondul fricii de replici în urma celor
Spania/ Cel puțin 212 decese atribuite temperaturilor ridicate din ultimele zile (estimări)
Cel puțin 212 decese înregistrate de duminică până miercuri în Spania pot fi puse pe seama valului de căldură care a afectat țara zilele acestea, conform datelor publicate de Institutul de Sănătate Carol al III-lea din Madrid, transmite joi AFP. În aceeași perioadă din 2025, 98 de decese au fost atribuite aceleiași cauze, conform acestor date.
Cutremure în Venezuela / Statele Unite, China, America Latină, Uniunea Europeană își oferă ajutorul
Majoritatea statelor din America Latină au promis că vor ajuta Venezuela după puternicele două seisme care au făcut cel puțin 32 de morți, iar Statele Unite au anunțat mobilizarea unor echipe de sal
Persoane rănite și servicii de utilități perturbate în urma unui seism de 5,6 produs în nordul Californiei
Un seism cu magnitudinea 5,6 s-a produs miercuri în apropierea orașului Willits, comitatul Mendocino, în nordul Californiei, fiind raportate câteva persoane rănite și perturbarea serviciilor de utilități și a activităților comerciale, informează Xinhua. Cutremurul a declanșat de asemenea alerte emise prin Sistemul de avertizare timpurie &icir
Canicula continuă să afecteze Europa
Europa continuă să fie afectată în această perioadă de caniculă, Franța, Belgia, Regatul Unit, Spania, Austria sau Danemarca numărându-se printre țările cu temperaturi neobișnuit de ridicate pentru această perioadă. Iată ultimele noutăți privind acest val de căldură care afectează continentul european, potrivit AFP. În Franța, nivelul maxim d
UPDATE Cutremure în Venezuela/ Cel puţin 32 de morţi şi peste 700 de răniţi (preşedinte)
Președintele interimar a Venezuelei, Delcy Rodriguez, a anunțat joi că cel puțin 32 de persoane și-au pierdut viața și alte peste 700 au fost rănite în urma a două seisme cu magnitudinea 7,2, respectiv 7,
Două cutremure de magnitudine foarte mare au lovit Venezuela, clădiri prăbușite în Caracas (GALERIE FOTO/VIDEO)
Două cutremure puternice, cu magnitudini de 7,2 și 7,5 conform serviciului seismologic american (United States Geological Survey, USGS), au lovit succesiv miercuri Venezuela, unde jurnaliști ai AFP au văzut clădiri prăbușite și au asistat la scene de panică în capitala Caracas. Niciun bilanț nu a fost făcut public imediat. Conform USGS,
VIDEO Cutremur cu magnitudinea 6,9 în nordul Japoniei
Un cutremur cu magnitudinea de 6,9 a fost înregistrat joi în largul nordului Japoniei, a anunțat Agenția Meteorologică Japoneză, precizând că nu există risc de tsunami, transmite AFP. Acest cutremur s-a produs în Oceanul Pacific, în largul prefecturii Iwate, la nord de insula principală Honshu, la o adâncime
Luni și marți au fost cele mai călduroase zile de iunie înregistrate de Spania în ultimii 76 de ani
Luni și marți au fost cele mai călduroase zile înregistrate în Spania pentru luna iunie din 1950, a anunțat miercuri Agenția Națională de Meteorologie (Aemet), pe fondul unui val de căldură care cuprinde Europa, transmite AFP. Spania este obișnuită cu temperaturi extreme, dar în ultimii ani s-a confruntat cu o frecvență și in
Record de temperatură doborât în Regatul Unit pentru luna iunie
Recordul de temperatură din Regatul Unit pentru luna iunie a fost doborât miercuri, când 35,8 grade Celsius au fost înregistrate la Wiggonholt, în sudul Angliei, a anunțat agenția națională de meteorologie din această țară, citată de AFP. Acest record va fi 'foarte probabil doborât din nou, mai târziu &i
Un seism cu magnitudinea 5,6 s-a produs în nordul Californiei
Un seism cu magnitudinea 5,6 s-a produs miercuri în comitatul Mendocino din nordul statului american California, potrivit Serviciului de prospectare geologică al Statelor Unite (USGS), citat de Reuters. Acest cutremur de pământ, înregistrat la o distanță de aproximativ 11 kilometri nord de Redwood Valley, s-a produs la ad&aci
Caniculă: OMS cere prioritate pentru investiții în sisteme de sănătate reziliente
Directorul general al Organizației Mondiale a Sănătății (OMS) a îndemnat marți țările lumii să facă 'o prioritate' din investițiile în sisteme de sănătate reziliente, pentru ca acestea să reziste mai bine la valurile de căldură devenite din ce în ce mai frecvente și mai intense, informează AFP. 'Valul de căldură c
'Fiecare dorea să fie primul', astronauții din epoca Apollo erau mai competitivi (pilot Artemis 2)
Multe s-au schimbat de când NASA a trimis ultima dată astronauți pe Lună - inclusiv atitudinile astronauților care au participat la aceste misiuni, conform declarațiilor astronautului Victor Glover, pilotul misiunii Artemis 2 care a străbătut distanța de la Pământ la Lună în aprilie, transmite miercuri Space.com. 'Câ
Centrul Căii Lactee, fotografiat cu o acuratețe deosebită de telescopul european Euclid
60 de milioane de stele și o calitate a imaginilor nemaivăzută până acum pentru o regiune atât de vastă a cerului: Agenția Spațială Europeană (ESA) a dezvăluit miercuri fotografii cu centrul Căii Lactee, care ar trebui să permită identificarea unor noi exoplanete, informează AFP. 'Galaxia noastră, Calea Lactee, este un disc, es














