OpenAI lansirao novi alat koji generira video iz teksta. Priznajemo, toliko je dobar da je pomalo zastrašujuće

Sora, koja je trenutno dostupna nekolicini ljudi, iz kratkih upita ili fotografija generira snimke duljine do jedne minute

FOTO: OpenAI/Twitter

OpenAI je predstavio novi alat, koji iz tekstualnih upita može generirati kratke videozapise. Novi alat, predstavljen u četvrtak, nazvan je Sora, prema japanskoj riječi za “nebo”. Sora, prema objavama na blogu tvrtke, uz tekstualne upite za generiranje videozapisa u trajanju jedne minute može stvoriti i video na temelju fotografije ili proširiti postojeće snimke novim materijalom.

“Učimo umjetnu inteligenciju da razumije i simulira fizički svijet u kretanju, a cilj je stvoriti alat kao pomoć ljudima u rješavanju problema koji zahtijevaju interakciju u stvarnom svijetu”, navodi OpenAI u svom blogu.

Snimke su vrlo impresivne

Jedan od videa koji je generirala Sora, a koji prema mišljenju tvrtke dobro pokazuje njene sposobnosti, temeljio se na upitu – “Filmski trailer koji prikazuje avanture tridesetogodišnjeg svemirskog čovjeka koji nosi crvenu vunenu pletenu motociklističku kacigu, plavo nebo, slana pustinja, kinematografski stil, snimano na 35mm filmu, žive boje”.

Primjere su objavili i na Twitteru, pa tako i onaj za “animiranu scenu koja prikazuje krupni plan niskog pahuljastog čudovišta koje kleči pokraj crvene svijeće koja se topi”. Upute su bile prilično detaljne, pa su iz OpenAI dodali niz naputaka: “umjetnički stil je 3D i realističan, s fokusom na osvjetljenje i teksturu. Atmosfera je puna čuđenja i znatiželje, dok čudovište gleda u plamen raširenih očiju i otvorenih usta. Njegova poza i izraz odaju osjećaj nevinosti i razigranosti, kao da prvi put istražuje svijet oko sebe. Korištenje toplih boja i dramatične rasvjete dodatno poboljšava ugodnu atmosferu slike”.

OpenAI je objavio i generiranu snimku divovskih vunenih mamuta, koji se približavaju kameri gazeći kroz snježno prostranstvo. “Njihovo se dugo vuneno krzno lagano vijori na vjetru dok hodaju. Vide se snijegom prekrivena stabla i dramatične snježne planine u daljini. Svjetlo je popodnevno s plamenastim oblacima, a Sunce visoko u daljini stvara topli sjaj. Niski pogled kamere zadivljujuće snima velikog krznenog sisavca s prekrasnim kadrovima, dubina polja”, stoji u upitu.

Altman generirao videozapise za neke tviteraše

Tvrtka je objavila da je pristup Sori omogućen manjem broju znanstvenika, istraživača i kreatora videa. Stručnjaci će sada testirati Soru na podložnost zaobilaženja OpenAI-jevih uvjeta korištenja, koji između ostalog zabranjuju “ekstremno nasilje, seksualni sadržaj, slike pune mržnje, sličnosti sa slavnim osobama ili intelektualno vlasništvu drugih”.

Premda tvrtka nudi ograničeni pristup Sori, izvršni direktor Sam Altman generirao je neke upite koji su imali korisnici Twittera. Videozapisi koje je generirala Sora nose žig koji pokazuje da ih je napravio AI, koji je vidljiv i na snimci “dva retrievera koji vode podcast na planini”, te prilično bizarnoj “biciklističkoj utrci raznih životinja”.

ChatGPT je odmah postao veliki hit

Tvrtka je predstavila svoj generator nepokretnih slika, Dall-E 2021. godine, a generativni AI chatbot ChatGPT debitirao je u studenom 2022. godine i od tada vrlo brzo došao do 100 milijuna korisnika.

Uvidjevši da je ChatGPT golemi hit, druge tvrtke su promptno lansirale svoje konkurente, koji su mogli i generirati rudimentarne videozapise. Te snimke bi bile uglavnom vrlo kratke, tek ovlaš povezane s upitima korisnika. Google i Meta su ranije izjavile da su u procesu izrade generativnih video alata, koji još uvijek nisu dostupni javnosti.

Iz OpenAIja su u srijedu najavili novi eksperiment u kojem će se dodati “dublja memorija” u ChatGPT, kako bi mogao zapamtiti više razgovora koje ima s korisnikom.

Koji materijal je korišten za učenje?

OpenAI nije otkrio koliko je, niti koje je snimke koristio za obuku Sore. Jedino što su otkrili New York Timesu je to da su svi materijali na kojima se učio model bili javno dostupni i licencirani od vlasnika autorskih prava.

Tvrtka je u više navrata imala problema s materijalima kojima uči svoje AI alate, podsjeća The Guardian. Nekoliko puta su tuženi zbog navodnog kršenja autorskog prava prilikom obuke, tijekom koje se probavljaju goleme količine materijala preuzetog s interneta. Potom imitiraju slike ili tekst sadržan u tim skupovima podataka.