2016-2022 All Rights Reserved.平安財經(jīng)網(wǎng).復制必究 聯(lián)系QQ 備案號:
本站除標明“本站原創(chuàng)”外所有信息均轉(zhuǎn)載自互聯(lián)網(wǎng) 版權(quán)歸原作者所有。
郵箱:toplearningteam#gmail.com (請將#換成@)
Meta首席AI科學家楊立昆指出了最近OpenAI公布的視頻AI工具Sora演示視頻中的錯誤,老奶奶吹蠟燭火苗沒有變動,東京街頭走動的女郎步伐并不正常,多處細節(jié)顯示這一模型并未真正理解物理世界。
1.Sora是一個文生視頻AI模型,它通過大規(guī)模的視覺數(shù)據(jù)訓練一個具備通用能力的生成模型,只要輸入幾個關(guān)鍵詞,就可以利用這一模型生成一段視頻,在公開的演示視頻當中,甚至這段視頻還包含鏡頭設(shè)計,體現(xiàn)出了很高的完成度。
2.人們在Sora身上看到了擴散模型和大模型能力的完美融合,OpenAI把視頻的每一幀都轉(zhuǎn)化成為視覺補丁,這種最小單位類似于GPT當中的token,它是組成視頻和圖像的基本部分,這些單位都可以被打破甚至重組。視頻生成過程中擴散模型負責生成效果,這也就是為何Sora可以從現(xiàn)有的靜態(tài)圖像中生成視頻。
3.Sora解決了一些之前技術(shù)上難以突破的問題,影視制作行業(yè)受到前所未有的沖擊。這一模型的革命性進步就是生成的視頻長度可以達到1分鐘,另外幾個熱門模型Pika生成長度在3秒、Runway的生成長度在18秒,Sora讓AI視頻真正可以成為生產(chǎn)力。
4.Sora可以降低內(nèi)容創(chuàng)作者的門檻,它簡單的使用方法和較低的部署成本能大幅度增加視頻行業(yè)工作者的數(shù)量,只要一句話、幾個關(guān)鍵詞就可以把想法表達出來,有利于人們表達自己的創(chuàng)意。
5.基于模擬世界的能力,在更多領(lǐng)域當中創(chuàng)造出新的事物,這是生成式模型學習的重要特征,它并不是記住數(shù)據(jù),而是在數(shù)據(jù)的基礎(chǔ)上展現(xiàn)出強大的創(chuàng)造能力,這種方法訓練出的AI將無限逼近真實世界。
2016-2022 All Rights Reserved.平安財經(jīng)網(wǎng).復制必究 聯(lián)系QQ 備案號:
本站除標明“本站原創(chuàng)”外所有信息均轉(zhuǎn)載自互聯(lián)網(wǎng) 版權(quán)歸原作者所有。
郵箱:toplearningteam#gmail.com (請將#換成@)