Tai ne filmas – tai AI“: kaip „Runway Gen-4.5“ tiesiog pakėlė teksto į vaizdo įrašą AI kartelę

Estimated read time 3 min read

Jums gali būti atleista, kad galvojate, kad tai yra mokslinės fantastikos filmo scenarijaus pradžia. „Bet ne – dar tik 2025 m., o dirbtinis intelektas darosi siaubingai gerai paverčiantis paprastą anglų kalbą judančiais paveikslėliais.

„Gen-4“ ką tik sumažėjo startuoliui „Runway“. 5, ir žmonės daro liūdną dvigubą taką. Gen-4, pagal jų pačių paleidimo postą.

5 iš teksto raginimų gali išgauti kinematografiškus, tikroviškus vaizdo įrašus – su patikima fizika, tikrovišku judesiu ir niuansuotomis vaizdinėmis detalėmis.

Daiktai turi svorį ir pagreitį, objektai juda taip, kaip turėtų, skysčiai bėga natūralia vaga, o plaukai, audinys, apšvietimas, tekstūros – viskas limpa nuo kadro prie kadro.

Tai būtų buvę įspūdinga prieš metus ar dvejus. Bet žinote, kas iš tikrųjų yra laukinis? Kaip Gen-4. Teigiama, kad 5 aplenkia gigantų supertelefonų etaloninius bandymus.

Neseniai paskelbtoje nepriklausomoje „Video-AI“ pirmaujančiųjų sąraše, palyginti su kitomis teksto į vaizdo įrašus sistemomis, jis pasiekė aukščiausią balą ir pralenkė modelius, sukurtus daug didesnėse laboratorijose.

Taigi, ką tai reiškia, jei esate kūrybingas, pasakotojas ar tiesiog žmogus, kuriam rūpi žiniasklaidos ateitis?

Staiga kuriant trumpametražį filmą ar vaizdinį pikį – galite tai pavadinti kinematografine reklama – neapriboja kameros, komandos ir studijos biudžetas.

Turėdami gerą raginimą, apšvietimo instrukcijas ir kameros kampų aprašymus galite gauti kažką, kas atrodytų kaip tikras vaizdo įrašas.

Tai yra mėgėjiško eksperimento ir profesionalaus lygio produkcijos riba.

Tačiau pripažinkime: tai nėra tobula. Kilimo ir tūpimo takas patys pripažįsta Gen-4. 5 vis dar kliūna su „priežastiniais samprotavimais“ – efektai (ir afektai) atsiranda anksčiau už priežastis (dar kam nors palietus rankeną atsidaro durys), arba daiktai dingsta/gimsta mistiškai tarp rėmų.

Tai gali atrodyti kaip apgaulė, bet būtent tai yra trūkumai, kurie primena, kad turite reikalų su sintetine laikmena.

Jei siekiate tikroviškumo – pavyzdžiui, trumpametražio filmo ar animacijos, kuriai reikia tikroviškumo – galbūt tie maži trūkumai gali atitraukti dėmesį nuo patirties.

Vis dėlto negaliu atitraukti akių nuo tokios technologijos. Tai tarsi perduoti pasauliui kišenės dydžio kino studiją.

Tarkime, kad esate studentas ir turite idėją apie įspūdingą mažą spekuliacinės fantastikos sceną – užuot ieškoję aktorių, rekvizitų ir įrangos aukštai ir žemai, tiesiog įveskite kai kuriuos parametrus, perbraukite vieną ar du slankiklius ir būk: vizuali istorija.

Indie autoriams, istorijų iš užmirštų pasaulio kraštų pasakotojams, nepasiturintiems – tokia prieiga labai išlygina žaidimo lauką.

Kita vertus, atsidaro užtvarai. Kai bet kas gali sukurti įtikinamą, nebrangų vaizdo įrašą be specialaus mokymo ar įrangos, kas atsitiks su filmų gamybos darbais – su autorių teisėmis – su „autentiškumu“? Ir kaip mes galime pradėti tikrinti, kas yra tiesa, palyginti su „AI-tiesa“?

DI sukurtų vaizdo įrašų revoliucija čia nesibaigė. Tai jau čia. Su Gen-4. 5, tai ne tik išmaniųjų filtrų ar animacinių filmų naudojimas.

Artėjame prie turinio, kurį, jei ne dėl jo vaizdinių savybių, galėtumėte patikėti tikru. O jei esate kūrėjas, tai tikrai įdomu… ir kelia siaubą.

Nuoroda į informacijos šaltinį

Jums tai gali patikti

Daugiau iš autoriaus