Sora問世一句話生成 1 分鐘視頻

2024年 2月 16日 12:52

作為OpenAI 首推的文本轉(zhuǎn)視頻模型，Sora能夠根據(jù)文本指令或靜態(tài)圖像生成長達 1分鐘的視頻，其中包含精細復雜的場景、生動的角色表情以及復雜的鏡頭運動。同時也接受現(xiàn)有視頻擴展或…

作為OpenAI 首推的文本轉(zhuǎn)視頻模型，Sora能夠根據(jù)文本指令或靜態(tài)圖像生成長達 1分鐘的視頻，其中包含精細復雜的場景、生動的角色表情以及復雜的鏡頭運動。同時也接受現(xiàn)有視頻擴展或填補缺失的幀。

每條提示60秒的視頻長度與Pika Labs的3秒、Meta Emu Video的4秒、和Runway公司Gen-2的18秒相比，妥妥地鐵贏了。并且從官方發(fā)布的演示來看，無論從視頻流暢度還是細節(jié)表現(xiàn)能力上，Sora的效果都相當驚艷。

比如官推里這條14秒的東京雪景視頻。

提示詞：Beautiful, snowy Tokyo city is bustling. The camera moves through the bustling city street, following several people enjoying the beautiful snowy weather and shopping at nearby stalls. Gorgeous sakura petals are flying through the wind along with snowflakes.

「美麗的，被雪覆蓋的東京正繁忙著。鏡頭穿過繁忙的城市街道，跟隨著幾個享受雪景和在附近攤位購物的人。美麗的櫻花瓣隨風飄落，與雪花一同飛舞?！?/p>