當前位置：首頁 - 元宇宙 - 正文

Sora成不了王炸？Meta人工智能負責人銳評：搞搞視頻就得了

來源：懂視網(wǎng) 責編：洛辭桉時間：2024-02-23 18:16:03

導(dǎo)讀OpenAI近期推出的視頻生成模型Sora在業(yè)界引發(fā)了廣泛關(guān)注，被視為視頻生成技術(shù)的一大飛躍。盡管Sora因其卓越的視頻穩(wěn)定性和清晰度而備受市場喜愛，但一些來自競爭對手的科學(xué)家卻對其持保留意見。

OpenAI近期推出的視頻生成模型Sora在業(yè)界引發(fā)了廣泛關(guān)注，被視為視頻生成技術(shù)的一大飛躍。盡管Sora因其卓越的視頻穩(wěn)定性和清晰度而備受市場喜愛，但一些來自競爭對手的科學(xué)家卻對其持保留意見。盡管如此，仍有人對Sora寄予厚望，認為它有可能成為人工智能領(lǐng)域的新高峰——世界模擬器，這也是OpenAI所追求的目標。

OpenAI也在其官網(wǎng)文章中寄望，Sora絕不僅僅是個視頻生成器，而是一個現(xiàn)實世界的模擬器。通過學(xué)習(xí)和模擬數(shù)據(jù)分布，生成與真實世界相似的虛擬樣本，從而給現(xiàn)實世界提供預(yù)知信息。但這一前景被Meta的首席AI科學(xué)家Yann LeCun公開反駁，這位以直言不諱聞名的AI大佬直言：搞搞視頻就好，別吹有的沒的。

注定失敗的模擬器

LeCun在X上公開發(fā)文稱，通過生成像素來對世界進行模擬是一種資源浪費，且注定會失敗。而該貼也引發(fā)了極大關(guān)注，一眾網(wǎng)友在評論區(qū)華山論劍。簡單來說，LeCun認為Sora模型試圖推斷太多不相關(guān)的細節(jié)，就像是通過試圖分析足球的材料來判斷足球的運行軌跡。

他指出，生成式模型適用于文本內(nèi)容，因為文本是離散的，且是由數(shù)量有限的符號組成的數(shù)據(jù)，在這種情況下，處理預(yù)測中的不確定性變得十分容易。但如果換到以像素為單位的預(yù)測領(lǐng)域，不確定性就會變得非常棘手，且不可能成功。

底下的網(wǎng)友也紛紛發(fā)言，有人稱Sora雖然令人印象深刻，但幾乎每個場景都可能出現(xiàn)邏輯問題，比如藝術(shù)家測試視頻中三頭小狼莫名其妙分裂成五頭小狼。這讓模擬現(xiàn)實變得多少不太靠譜。

也有人說，Sora是應(yīng)夢想而生，人可以做清醒的夢，或者做不太清醒的夢。這種看起來不太清醒的發(fā)言則是賭Sora有那么一些可能實現(xiàn)OpenAI“世界模擬器”的壯言。

與此同時，LeCun所在的Meta上周發(fā)布了一個視頻聯(lián)合嵌入預(yù)測架構(gòu)V-JEPA，據(jù)稱其通過觀看視頻來教導(dǎo)大模型理解和對物理世界建模，算是Sora之外，對世界模擬器的另一種嘗試。

此外，V-JEPA還可以靈活丟棄不可預(yù)測的信息，而將訓(xùn)練和樣本運行效率提升1.5-6倍。不過，V-JEPA顯然顯然沒在市場引發(fā)多大動靜，相比Sora要低調(diào)很多。

聲明：本網(wǎng)頁內(nèi)容旨在傳播知識，若有侵權(quán)等問題請及時與本網(wǎng)聯(lián)系，我們將在第一時間刪除處理。TEL:177 7030 7066 E-MAIL:11247931@qq.com

熱門焦點

首頁

元宇宙

NFT

區(qū)塊鏈

虛擬人

元宇宙科技

元宇宙房產(chǎn)

元宇宙游戲

AR/VR

AI

知識百科

Sora成不了王炸？Meta人工智能負責人銳評：搞搞視頻就得了

最新推薦

猜你喜歡

熱門推薦

Sora成不了王炸？Meta人工智能負責人銳評：搞搞視頻就得了

最新推薦

猜你喜歡

熱門推薦

Sora成不了王炸？Meta人工智能負責人銳評：搞搞視頻就得了