A Lumiere, a Google generatív mesterséges intelligencia eszköze kiváló minőségű képeket és videókat hoz létre szövegből
Folytatva mesterséges intelligencia (AI) megoldásainak fejlesztését, a Google most mutatta be a Lumiere nevű új generatív AI-eszközt. Innovatív abban, hogy képes rendkívül valósághű és jó minőségű képeket és videókat generálni szöveges promptok és gépi tanulás segítségével.
Ami a videókat illeti, a fő újítás az, hogy az eszköz képes olyan valósághű mozgásokat létrehozni, mint például a séta, ami még mindig problémát jelent a jelenlegi generatív AI-megoldásoknál. A szoftver nagymértékben javítja a mozgást a videokockák generálásának új megközelítésével, amely az összes képkockát egyetlen lépésben hozza létre, hogy minimalizálja a mozgási hibákat, és a lehető legvalószínűbb legyen. Összehasonlításképpen, a jelenlegi AI-eszközök csak a kulcskockák felhasználásával hoznak létre videót, és betanítják a modellt a hiányzó képkockák létrehozására.
A Lumiere szöveges promptokat használ a tartalom létrehozásához, amelyet az online képek és videók hatalmas könyvtárával képez ki. A rendkívül valósághű tartalom kifejlesztését segíti továbbá egy olyan módszerkészlet, amely a nyelv összes szavát egymáshoz tudja kapcsolni olyan vektorok segítségével, amelyek lehetővé teszik az AI számára, hogy pontosabb tartalmat hozzon létre.
A Lumiere más mesterséges intelligencia-eszközökkel kombinálható, így még változatosabb, de még mindig jó minőségű tartalmat hozhat létre. Így lehet olyan videókat készíteni, ahol például egy objektumot lecserélnek egy másikra, a videót más stílusban készítik el, a képet animációvá alakítják, a kép egy részét animálják stb.