大河網(wǎng)訊(記者 婁恒 劉高雅)深耕人工智能領(lǐng)域20余年的王長虎,是中國網(wǎng)絡(luò)媒體論壇舉辦期間備受關(guān)注的嘉賓之一。作為愛詩科技創(chuàng)始人兼CEO、PixVerse掌門人,他在接受大河網(wǎng)記者采訪時,分享了自己對視頻生成大模型發(fā)展歷程的深刻洞察,以及對AI未來方向的判斷與展望。
從抖音到PixVerse
為什么偏要走那條“最難的路”?
“因為過去20年都在人工智能領(lǐng)域,過去幾年也參與了像抖音、TikTok等的發(fā)展過程,所以我認為,視頻實際上是離用戶特別近的內(nèi)容。”王長虎說,“視頻生成大模型一旦能夠做好,其產(chǎn)品影響力、商業(yè)化前景不容小覷。”
然而,這條路并不擁擠。“但此前,這個方向幾乎沒有人看到。我們走了一條非常艱難的道路,但我們堅信這件事我們能做成。”
過去三年,愛詩科技見證了視頻生成大模型發(fā)展的歷程,也是全球最早做視頻生成的企業(yè)之一。
王長虎坦言,他的信心源于親身經(jīng)歷。“由于完整參與了抖音、TikTok從0到1的進化,特別是背后的視頻AI能力。所以當別人沒有信心做出來的時候,我們認為我們有信心。”
無限生成、實時互動
視頻的“世界模型”長什么樣?
在描述視頻生成大模型技術(shù)突破時,王長虎描繪了一個極具想象力的場景:“一旦創(chuàng)造完這個設(shè)計之后,它就自己在運行,相當于你看到的視頻就無限地在進化、無限地在生成。”
他強調(diào),用戶可以通過社交或語音互動,實時改變視頻里面的內(nèi)容。“實時互動就意味著你這邊輸入完,那邊已經(jīng)改變了,這是一個創(chuàng)作過程。”
“一般生成的視頻也都是最長30秒,但我們這個最長能生成無限。”王長虎說,空間上可以無限延展,內(nèi)容上也可以實時改變。
過去20年,整個互聯(lián)網(wǎng)技術(shù)發(fā)展受到一個動力的驅(qū)動,就是人和信息交互方式的變化。從“人主動找信息”的搜索引擎,到“信息找人”的推薦算法,再到如今的“人創(chuàng)世界”。
王長虎舉例說:“比如我們有一個場景,一個人在睡覺。通過不同的方式可以把他吵醒,我們輸入一些指令,一只小貓會過來把他吵醒;蛘甙芽Х却蚍屗炎雷臃銎饋淼鹊。每一個想法都可以創(chuàng)造一個世界,這個世界里你可以成為世界之主。”
基于這一變革,王長虎描繪了這樣一幅未來圖景:“大家可以暢想,我們現(xiàn)在看的劇,未來可能就是這種交互式的。每個人都可以讓他有不同的劇情和結(jié)果。”他甚至提出一個有趣的問題:“未來會不會依然有電影院的存在?每個人看的電影,因為交互的不同,都可能有不同的結(jié)果,這是想起來就非常興奮的事情。”
從“雪山救狐貍”到全民AI
這不是搶飯碗,是打開新世界
王長虎認為“AI的發(fā)展可以加速每一個行業(yè)的發(fā)展,它不會替換很多重要的行業(yè),而是會帶來更多的多元化的機會”。他舉例說:“如今,不少人追星,未來可以有AI世界,我們或許也會有一些虛擬的偶像、定制偶像,讓每個人可以看到更大的世界。”
談及近期網(wǎng)上火爆的“雪山救狐貍”等網(wǎng)友用AI生成視頻的梗,王長虎表示并不意外。
“我覺得非常有意思。”他回憶道,“在2024年的時候,大部分視頻公司都在服務(wù)專業(yè)創(chuàng)作者,我們當時的目標就是希望每一個能夠玩抖音、玩快手、玩TikTok的普通人都能夠輕而易舉地創(chuàng)作AI內(nèi)容。”
“所以出現(xiàn)這種熱潮,我覺得不意外,我們也是深度推動者。”王長虎說,“鼓勵大家都來玩AI,降低視頻生成的門檻。”
王長虎觀察到,行業(yè)認知正在發(fā)生轉(zhuǎn)折,“之前真正關(guān)注到這個行業(yè)的人還沒那么多,但現(xiàn)在不一樣,現(xiàn)在不少人都意識到這是一個大市場,也是一個非常好的機會。我們也愿意與文旅等行業(yè)一起攜手共創(chuàng)未來”。
