作為OpenAI 首推的文本轉(zhuǎn)視頻模型,Sora能夠根據(jù)文本指令或靜態(tài)圖像生成長(zhǎng)達(dá) 1分鐘的視頻,其中包含精細(xì)復(fù)雜的場(chǎng)景、生動(dòng)的角色表情以及復(fù)雜的鏡頭運(yùn)動(dòng)。同時(shí)也接受現(xiàn)有視頻擴(kuò)展或填補(bǔ)缺失的幀。
每條提示60秒的視頻長(zhǎng)度與Pika Labs的3秒、Meta Emu Video的4秒、和Runway公司Gen-2的18秒相比,妥妥地鐵贏了。并且從官方發(fā)布的演示來(lái)看,無(wú)論從視頻流暢度還是細(xì)節(jié)表現(xiàn)能力上,Sora的效果都相當(dāng)驚艷。
比如官推里這條14秒的東京雪景視頻。
提示詞:Beautiful, snowy Tokyo city is bustling. The camera moves through the bustling city street, following several people enjoying the beautiful snowy weather and shopping at nearby stalls. Gorgeous sakura petals are flying through the wind along with snowflakes.
「美麗的,被雪覆蓋的東京正繁忙著。鏡頭穿過(guò)繁忙的城市街道,跟隨著幾個(gè)享受雪景和在附近攤位購(gòu)物的人。美麗的櫻花瓣隨風(fēng)飄落,與雪花一同飛舞?!?/p>
穿著時(shí)尚的女性漫步在霓虹背景的東京街頭,地面有積水倒影。

對(duì)于五官和皮膚的刻畫十分真實(shí),特別是痘印和法令紋,細(xì)節(jié)讓人驚嘆。

猛犸象自冰川雪原中緩步從來(lái),背后升騰起雪霧。

燭火旁純真頑皮的3D動(dòng)畫小怪物,光影、表情和毛茸茸的細(xì)節(jié)滿分:

一名24歲女性的眼部特寫,足以以假亂真。
