Hírek

Új szöveg-videó generátor az OpenAI-tól

#image_title
370views
Új szöveg-videó generátor az OpenAI-tól

Állókép a Sorában készített új mintavideók egyikéből – teljes mértékben mesterséges intelligencia generált.

TikTok-klipek, animáció és minden, amit filmre vettek – a videó egy mindenütt jelenlévő médium, hatalmas befolyással, de az ötletek képernyőre viteléhez szükséges tudás és felszerelés drága és nehezen beszerezhető lehet.

A mesterséges intelligenciának (AI) köszönhetően ezek az akadályok csökkennek.

A mesterséges intelligencia (AI) iparág vezetője, az OpenAI ma jelentette be legújabb projektjét, a „Sora”-t. A szöveg-videó modell értelmezi az írásos felszólítást, és tényleges felvételt készít.

A felhasználó számára ugyanúgy működik, mint a ChatGPT, egy szövegre kérő modell és a DALL·E, egy prompt-to-image modell, mindkettő OpenAI projekt.

Jelenleg a Sora promptonként 60 másodpercnyi videót tud generálni. A jelenlegi verzió képes videót generálni állókép felhasználásával, kiterjeszteni és kitölteni a valódi videókból származó képkockákat, valamint videókat készíteni írásos felszólítások alapján.

Az AI egy diffúziós modell. Elveszi a promptot, megkeresi a hozzá kapcsolódó képeket, lebontja azokat, majd az AI újraépíti a képeket úgy, ahogyan „akarja”, hogy kinézzenek.

A diffúziós mesterséges intelligencia fejlesztésének korábbi szakaszaiban, mint például a DALL·E, a képeket újra lehetett készíteni, de a feliratok és a szöveg torzult. A modell későbbi verzióiban, a DALL·E 2-ben és 3-ban fejlesztések történtek, és az általuk használt információs készlet a Sorát is táplálja.

Miközben a szoftver lehetőségeket hordoz magában, és mindenki számára elérhetővé teszi a videómunkát, megnövekedett kockázattal is jár.

A mély hamis képek egyre nagyobb aggodalmat keltenek. A tavalyi tanulmány során megkérdezett 95 000 mély hamis videó 98%-a mély hamis pornográfia volt. A szókimondó videók 99%-a nőkről szólt. A nagy horderejű streamerek és hírességek, köztük Taylor Swift esetei azonban a közelmúltban jelentős fényt derítettek erre a kérdésre.

Míg a törvényhozás világszerte lassan felzárkózik a technológiához, a Sora fejlesztőcsapata néhány megelőző intézkedést írt be, amelyek az erőszakos és szexuális tartalom generálására való potenciális felhasználásával kapcsolatosak.

„A kiterjedt kutatások és tesztelések ellenére – írja a Sora honlapja – nem tudjuk megjósolni, hogy az emberek milyen jótékony módon használják technológiánkat, vagy hogy az emberek milyen módon fognak visszaélni vele.”

A Sora a fejlesztés korai szakaszában jár, és még nem nyilvános.

Anisha Satya története.