4月12日,中國科學(xué)院深圳先進技術(shù)研究院舉辦「探Sora真相,論AI未來」人工智能沙龍講座。本次活動邀請到人工智能領(lǐng)域的專家學(xué)者圍繞人工智能領(lǐng)域前沿技術(shù)進行了深入探討和分析,並討論了Sora對AI基礎(chǔ)技術(shù)的推進作用。此次活動由深圳先進院先進計算與數(shù)字工程研究所、中國科學(xué)院與香港地區(qū)多媒體技術(shù)聯(lián)合實驗室共同主辦。
中國科學(xué)院院士、深圳先進院副院長鄭海榮在致辭中提到,人工智能帶來科學(xué)研究範(fàn)式的改變,正在深深影響材料、生命、信息和醫(yī)學(xué)等領(lǐng)域發(fā)展?!肝覀儜?yīng)以極高的敏感度去思考如何與人工智能技術(shù)相融合帶動相關(guān)領(lǐng)域的變革?!灌嵑s希望通過交流與合作,促進非人工智能領(lǐng)域的研究學(xué)者擁有人工智能的意識和思維,助力開拓學(xué)科的新疆域。
香港中文大學(xué)副教授李鴻升在《圖像生成和視頻生成前沿技術(shù)探索》主題報告中,介紹了實驗室團隊在面對生成模型評估困難、生成圖像文本跟隨性差、生成視頻一致性差、生成模型推理速度慢等多重挑戰(zhàn)時開發(fā)的一系列工作,包括文生圖模型評估方法HPS(Human Preference Score)、增強生成圖像的文本依從性方法CoMat、增強生成視頻的一致性方法Motion-I2V、擴展圖像生成模型至視頻生成方法AnimateLCM等。他說,「視頻生成模型的開發(fā)是一個龐大的系統(tǒng)工程,應(yīng)對這一挑戰(zhàn),算力資源和人員組織架構(gòu)都需要集中規(guī)劃,技術(shù)的開發(fā)需要有系統(tǒng)化的數(shù)據(jù)工程?!?/p>
騰訊科技高級研究員王鑫濤在《視頻生成探索及MINI-SORA的初步研究》的報告中提到,視頻生成正日益受到學(xué)術(shù)界和工業(yè)界的關(guān)注,隨著OpenAI Sora的發(fā)布,視頻生成技術(shù)的潛力和挑戰(zhàn)越來越明晰。他回顧了視頻生成技術(shù)的發(fā)展路線,以及Sora的出現(xiàn)為視頻生成技術(shù)帶來的啟發(fā)與思考?!高@是最好的時代也是最『壞』的時代,我們見證了人工智能技術(shù)的不斷突破,同時也必須一次次突破認(rèn)知才不至於『望洋興嘆』?!?/p>
Sora有望提高自動駕駛安全性
在圓桌對話中,5位人工智能領(lǐng)域的科學(xué)家們探討了Sora對AI基礎(chǔ)技術(shù)的推進作用,以及人工智能技術(shù)發(fā)展背後的思考。
談及視頻生成模型的應(yīng)用場景時,華為技術(shù)有限公司高級工程師蔡穎婕說道:「最直接的是在創(chuàng)作場景方面的應(yīng)用,Sora表現(xiàn)出的良好一致性和一部分對物理世界的理解能力,讓其有希望成為數(shù)據(jù)仿真器,解決自動駕駛等任務(wù)中的部分?jǐn)?shù)據(jù)問題,有利於提高安全性?!?/p>
那麼,Sora是如何模擬和理解物理世界的?「數(shù)據(jù)在Sora中起到了很大的作用,其中可能存在一部分使用了遊戲物理引擎仿真的數(shù)據(jù),再加上自然圖像大數(shù)據(jù)的訓(xùn)練導(dǎo)致Sora能在一定程度上理解物理規(guī)律,產(chǎn)生符合人類認(rèn)知的畫面?!估铠櫳治龅?。
王鑫濤同樣認(rèn)為數(shù)據(jù)在Sora中佔據(jù)十分重要的地方,他認(rèn)為網(wǎng)絡(luò)模型本身的學(xué)習(xí)方式或許與人類學(xué)習(xí)的模式不一樣,模型從大量數(shù)據(jù)中學(xué)習(xí)可能也可以自適應(yīng)地理解某種規(guī)律。
「物理規(guī)律是人類對於世界的某種『壓縮』,將一系列的物理現(xiàn)象濃縮到幾個公式來統(tǒng)一表達,某種程度上說,『壓縮』即智能?!瓜愀壑形拇髮W(xué)助理教授薛天帆補充道。
深圳先進院數(shù)字所多媒體集成技術(shù)中心主任董超從另一個角度提到,如果從Sora輸出的結(jié)果中,能推導(dǎo)出某種一致性規(guī)律,那麼即使可能與真實世界規(guī)律有偏差,也算是Sora世界中自成一體的「物理定律」。
「無論什麼樣的技術(shù)都是從人出發(fā),最終也是反饋到人類身上。我們應(yīng)該更多關(guān)注人本身,創(chuàng)造出有利的科研環(huán)境,讓一線的從業(yè)者和科學(xué)家們保持創(chuàng)造力和好奇心。技術(shù)需要被人掌控並回歸人類本身,才能讓前沿技術(shù)帶來正向價值、有利於社會發(fā)展?!苟f道。(記者林麗青)