Hírek

A Sora a ChatGPT-készítő OpenAI új szöveg-videó generátora. Íme, mit tudunk az új eszközről

#image_title
347views

NEW YORK — A ChatGPT gyártója most belevág a mesterséges intelligencia által generált videókba.

Ismerje meg Sorát – az OpenAI új szöveg-videó generátorát. Az eszköz, amelyet a San Francisco-i cég csütörtökön mutatott be, generatív mesterséges intelligencia segítségével azonnal rövid videókat készít írott parancsok alapján.

Nem Sora az első, aki bemutatta ezt a fajta technológiát. Az iparági elemzők azonban rámutatnak az eszköz által eddig megjelenített videók kiváló minőségére, és megjegyzik, hogy bevezetése jelentős ugrást jelent mind az OpenAI, mind a szövegből videóvá generálás jövője szempontjából.

Mindazonáltal, mint napjainkban a gyorsan növekvő mesterséges intelligencia térben minden, az ilyen technológia is félelmet kelt a lehetséges etikai és társadalmi következményekkel kapcsolatban. Íme, amit tudnod kell.

A Sora egy szöveg-videó generátor – akár 60 másodperces videókat is készíthet írásos felszólítások alapján generatív mesterséges intelligencia segítségével. A modell egy meglévő állóképből is képes videót generálni.

A generatív AI a mesterséges intelligencia egyik ága, amely újat hozhat létre. Ilyenek például a chatbotok, mint például az OpenAI ChatGPT, és a képgenerátorok, mint például a DALL-E és a Midjourney. Újabb és nagyobb kihívást jelent egy mesterséges intelligencia rendszer létrehozása videók generálására, de ugyanerre a technológiára támaszkodik.

A Sora még nem áll rendelkezésre nyilvánosan (az OpenAI szerint az eszköz hivatalos kiadása előtt egyeztet a döntéshozókkal és a művészekkel), és sok mindent még mindig nem tudunk. A csütörtöki bejelentés óta azonban a cég megosztott néhány példát a Sora által generált videókra, hogy megmutassa, mire képes.

Az OpenAI vezérigazgatója, Sam Altman az X-et, a korábban Twitter néven ismert platformot is felkérte a közösségi média felhasználóit, hogy küldjenek el azonnali ötleteket. Később valósághűen részletes videókat osztott meg, amelyek reagáltak az olyan felszólításokra, mint „két golden retriever podcastol egy hegy tetején” és „bicikliverseny az óceánon különböző állatokkal, amint drón kamerával bicikliznek a sportolók”.

Míg a Sora által generált videók bonyolult, hihetetlenül részletgazdag jeleneteket ábrázolhatnak, az OpenAI megjegyzi, hogy még mindig vannak gyenge pontok – köztük néhány térbeli és ok-okozati elem. Például az OpenAI hozzáteszi a honlapján: „Előfordulhat, hogy valaki beleharap egy sütibe, de utána előfordulhat, hogy a cookie-n nem lesz harapásnyom”.

Az OpenAI Sora nem az első a maga nemében. A Google, a Meta és az induló Runway ML olyan cégek közé tartoznak, amelyek hasonló technológiát mutattak be.

Ennek ellenére az iparági elemzők hangsúlyozzák az eddig megosztott Sora-videók látszólagos minőségét és lenyűgöző hosszúságát. Fred Havemeyer, a Macquarie amerikai mesterséges intelligencia- és szoftverkutatási részlegének vezetője elmondta, hogy a Sora bevezetése nagy előrelépést jelent az iparág számára.

„Nemcsak hosszabb videókat készíthet, tudomásom szerint akár 60 másodpercig is, de a készülő videók is normálisabbnak tűnnek, és úgy tűnik, hogy jobban tisztelik a fizikát és a való világot” – mondta Havemeyer. „Nem jelenik meg annyi ‘ivartalan völgy’ videó vagy töredék a videofeedeken, amelyek… természetellenesnek tűnnek.”

Noha az AI által generált videók terén az elmúlt év során „iszonyatos előrelépés” történt – beleértve a Stable Video Diffusion tavaly novemberi bevezetését –, a Forrester vezető elemzője, Rowan Curran szerint az ilyen videóknál több „összefűzést” igényelnek a karakter és a jelenet egységessége érdekében.

Sora videóinak konzisztenciája és hossza azonban „új lehetőségeket jelent a kreatívok számára, hogy mesterséges intelligencia által generált videók elemeit beépítsék a hagyományosabb tartalomba, és most akár teljes körű narratív videókat is generáljanak egy vagy néhány felszólítás alapján” – mondta Curran a The Theatre-nek. Az Associated Press pénteken e-mailben.

Bár Sora képességei a csütörtöki megjelenés óta megdöbbentették a megfigyelőket, továbbra is fennáll az aggodalom a mesterséges intelligencia által generált videóhasználat etikai és társadalmi vonatkozásai miatt.

Havemeyer például a 2024-es potenciálisan tele választási ciklus jelentős kockázataira mutat rá. Hozzátette, csalással, propagandával és félretájékoztatással kapcsolatos aggodalmakra utalva, hogy van egy „potenciálisan varázslatos” módja annak, hogy olyan videókat állítsanak elő, amelyek reálisan néznek ki és hangzanak.

„A generatív mesterséges intelligencia negatív externáliái 2024-ben a vita kritikus témája lesz” – mondta Havemeyer. „Ez egy jelentős probléma, amellyel minden vállalkozásnak és minden embernek szembe kell néznie ebben az évben.”

A technológiai vállalatok továbbra is okoskodnak a mesterséges intelligencia szabályozásával és annak kockázataival kapcsolatban, miközben a kormányok világszerte dolgoznak a felzárkózáson. Decemberben az Európai Unió megállapodott a világ első átfogó mesterségesintelligencia-szabályairól, de a törvény csak két évvel a végleges jóváhagyás után lép hatályba.

Csütörtökön az OpenAI közölte, hogy fontos biztonsági lépéseket tesz, mielőtt a Sorát széles körben elérhetővé tenné.

„Vörös csapattagokkal dolgozunk – olyan területek szakértőivel, mint a félretájékoztatás, a gyűlöletkeltő tartalom és az elfogultság –, akik ellenféllel tesztelik a modellt” – írta a vállalat. „Eszközöket is építünk a félrevezető tartalom észlelésére, például egy észlelési osztályozót, amely képes megmondani, hogy a videót a Sora hozta létre.”

Anna Makanju, az OpenAI globális ügyekért felelős alelnöke megismételte ezt, amikor pénteken felszólalt a müncheni biztonsági konferencián, ahol az OpenAI és 19 másik technológiai vállalat vállalta, hogy önkéntesen együttműködnek a mesterséges intelligencia által generált választási hamisítások elleni küzdelemben. Megjegyezte, a cég „meglehetősen óvatos módon” bocsátotta ki Sorát.

Ugyanakkor az OpenAI korlátozott információkat közölt a Sora felépítéséről. Az OpenAI technikai jelentése nem fedte fel, hogy Sora képzéséhez milyen kép- és videóforrásokat használtak – és a cég pénteken nem válaszolt azonnal a további megjegyzésekre vonatkozó kérésre.

A Sora kiadása az OpenAI és üzleti partnere, a Microsoft ellen indított perek hátterében is megérkezik, amelyeket egyes szerzők és a The New York Times indított a szerzői joggal védett írásművek ChatGPT képzésére való felhasználása miatt. Az OpenAI nem nyilvános díjat fizet az AP-nak a szöveges hírarchívum licencéért.

___

O’Brien Providence-ből (Rhode Island) jelentett.