OpenAI je nedavno objavil svojo najnovejšo revolucionarno tehnologijo – Sora.
Ta generativni model umetne inteligence za pretvorbo besedila v video je zaenkrat videti neverjetno impresiven, saj predstavlja ogromen potencial v številnih panogah.
Kaj je Sora?
Sora je OpenAI-jev generativni model umetne inteligence za pretvorbo besedila v video. To pomeni, da napišete besedilni poziv in ustvari se videoposnetek, ki se ujema z opisom poziva. Tu je primer.
Kako Sora deluje?
Tako kot modeli umetne inteligence, ki generirajo besedilo v sliko, kot so DALL·E 3, StableDiffusion in Midjourney, je Sora difuzijski model. To pomeni, da se začne z vsakim okvirjem videoposnetka, ki je sestavljen iz statičnega šuma, in uporablja strojno učenje za postopno preoblikovanje slik v nekaj, kar je podobno opisu v pozivu. Videoposnetki Sora so lahko dolgi do 60 sekund.
Kako lahko dostopam do Sore?
Sora je trenutno na voljo samo raziskovalcem. Se pravi strokovnjakom, ki dobijo nalogo, da poskušajo identificirati težave z modelom.
OpenAI še ni navedel datuma javne izdaje Sore, čeprav bo to verjetno leta 2024.