A kutatást Dr. Erik Guzik, az American University College of Business egyetemi adjunktusa vezette. Csapata a kreatív gondolkodás Torrance-tesztjét használta – egy évtizedek óta használt eszközt az emberi kreativitás felmérésére.
A kutatók nyolc választ mutattak be, amelyeket a ChatGPT, a GPT-4 mesterséges intelligencia motorral hajtott alkalmazás generált. Válaszokat küldtek a Montana Egyetem 24 diákjából álló kontrollcsoporttól is, akik Guzik professzor vállalkozói és személyes pénzügyi tanfolyamain vesznek részt – írja a Science kiadvány.
Ezeket a pontszámokat országszerte 2700 diákéval hasonlították össze, akik 2016-ban vettek részt a teszten. Minden választ a Scholastic Testing Service pontozta, amely nem tudta, hogy melyiket írták le, és melyiket nem.
Már nem lehet különbséget tenni az emberi és a mesterséges intelligencia szövegei között
Az eredmények a ChatGPT-t helyezték a kreativitás élére. Az AI-alkalmazás előkelő helyezést ért el a folyékonyság – a nagy mennyiségű ötlet generálásának képessége – és az eredetiség – az új ötletek kidolgozásának képessége – tekintetében. Nem teljesített olyan jól a rugalmasságban, a különböző típusú és kategóriájú ötletek generálásának képességében.
„A ChatGPT és a GPT-4 esetében először mutattuk meg, hogy az eredetiség tekintetében az első 1%-ban vannak. Ez újdonság volt” – mondta Guzik.
Örömmel állapította meg, hogy néhány tanítványa is a legjobb 1%-ban szerepelt. A ChatGPT azonban országosan felülmúlta a legtöbb egyetemi hallgatót.
A kutatók májusban mutatták be munkájukat a Southern Oregon University Kreativitás Konferenciáján.
„A ChatGPT azt mondta nekünk, hogy lehet, hogy nem értjük teljesen az emberi kreativitást, ami szerintem tisztességes. Ez azt is felvetette, hogy kifinomultabb értékelési eszközökre lehet szükségünk, amelyek különbséget tesznek az ember által generált és a mesterséges intelligencia által generált ötletek között” – mondta a professzor a konferencián.
A professzor azt is elmondta, hogy jobban meglepte, hogy milyen jól sikerült eredeti ötletek generálása, ami az emberi képzelet sajátossága.
„A konferencián megismerkedtem a GPT-3-mal kapcsolatos korábbi kutatásokról, amelyeket egy évvel ezelőtt végeztek” – mondta Guzik. „Akkoriban a ChatGPT nem ért el olyan jól, mint az emberek az eredeti gondolkodást igénylő feladatokban. Most a fejlettebb GPT-4-gyel az összes emberi válasz első 1%-ában van.”