一位年輕的女性走在充滿霓虹燈的東京街頭、兩艘戰(zhàn)船在咖啡杯里航行、黑人小伙在云端看書、古鎮(zhèn)巷子里迎接龍燈的男女老少……這些由Sora(一款文生視頻模型)生成的視頻效果足以“亂真”。
當(dāng)?shù)貢r(shí)間2月15日,OpenAI (一家海外人工智能公司)推出旗下首個(gè)文生視頻大模型Sora,同時(shí)展示了由它生成的48段視頻。該模型生成的視頻以超高的清晰度、連貫性、語義還原度引發(fā)業(yè)內(nèi)廣泛關(guān)注。
Sora的驚艷令人振奮,它的出現(xiàn)也可能會(huì)深遠(yuǎn)地影響到游戲、影視和廣告等內(nèi)容行業(yè)?!澳壳翱磥?,AIGC(生成式人工智能)相關(guān)工具的應(yīng)用,能夠有效提高媒體、設(shè)計(jì)等相關(guān)領(lǐng)域的內(nèi)容生產(chǎn)速度,利用AIGC工具進(jìn)行概念構(gòu)想和快速迭代,會(huì)成為未來這些行業(yè)工作流程中的重要一環(huán)。”中國藝術(shù)科技研究所數(shù)字藝術(shù)部主任張宜春接受新京報(bào)貝殼財(cái)經(jīng)專訪時(shí)說。
雖然技術(shù)路徑、呈現(xiàn)效果與Sora還存在差異,但生成式人工智能已經(jīng)成為國內(nèi)的熱門賽道,不少技術(shù)也已投入應(yīng)用。新京報(bào)貝殼財(cái)經(jīng)獨(dú)家獲悉,年初摘得iOS(蘋果旗下手機(jī)應(yīng)用商店)免費(fèi)榜冠軍的言情手游《世界之外》中的不少人物和劇情就來自人工智能生成。此外,2月6日上線的古裝探案劇《大唐狄公案》也用人工智能生成了古代長安城的全景鏡頭。不少CPC廣告(點(diǎn)擊付費(fèi)廣告)的物料也使用了人工智能生成。
華泰證券研報(bào)顯示,2023年實(shí)際誕生的文生視頻大模型達(dá)到數(shù)十個(gè),全球用戶數(shù)量超過百萬級別,但目前多數(shù)視頻模型仍處于產(chǎn)品早期階段。2024年各大公司加快了文生視頻模型的研發(fā)步伐。
Sora生成的視頻截圖。圖/IC
游戲行業(yè)
內(nèi)容生產(chǎn)、語音交互等領(lǐng)域已應(yīng)用AIGC,核心畫面仍需人工加入
2024年開年,網(wǎng)易旗下的無限流言情手游《世界之外》成為“黑馬”。但鮮少有人知道這款游戲的很多對話和美術(shù)都由人工智能生成。
“初期這個(gè)項(xiàng)目(《世界之外》)在內(nèi)部優(yōu)先級不高,甚至已經(jīng)到了‘待砍’的邊緣,但游戲的主策劃四處奔走,堅(jiān)持要把這個(gè)游戲發(fā)出來。這個(gè)團(tuán)隊(duì)人很少,所以這款游戲的很多人物和對話都是AI生成的。現(xiàn)在這個(gè)題材爆了,又緊急配了不少人,開始美化和修飾?!庇螒蛐袠I(yè)資深運(yùn)營林函(化名)向記者透露,他曾經(jīng)服務(wù)過多家主流游戲大廠。
網(wǎng)易2024年財(cái)報(bào)顯示,旗下《逆水寒》《蛋仔派對》等游戲大量使用AI技術(shù)。比如,基于伏羲人工智能模型的《逆水寒》手游中,融合了高智能NPC(非玩家角色)、AI捏臉、AI作詩、AI作畫、AI大宋頭條等?!兜白信蓪Α穭t提供了具有AI算法的用戶內(nèi)容生成工具,能夠降低用戶制作地圖的門檻,目前該游戲地圖總數(shù)突破了1億張,單張地圖最高游玩次數(shù)超1.2億次。另據(jù)貝殼財(cái)經(jīng)記者了解,目前不少游戲公司已經(jīng)在研究將AI用于3D建模的不同方向。
據(jù)林函介紹,目前的主流游戲廠商,在非核心內(nèi)容上都使用了AIGC,主要應(yīng)用領(lǐng)域有以下幾個(gè)方面:其一是游戲內(nèi)容生產(chǎn),包括圖形、圖像生成,游戲劇本創(chuàng)作,NPC智能生成等,甚至有的游戲中90%的過場圖都可以用AIGC再結(jié)合一些人工優(yōu)化生成,這是降本增效的方式;其二使用AI對話和語音交互,比如根據(jù)游戲策略和人物屬性,給NPC生成語言包,讓他更有交互和情感屬性;其三是在商業(yè)投放的過程中,用AI來預(yù)測和模擬部分玩家的行為,從而更好地調(diào)優(yōu)商業(yè)化數(shù)值。
“只要生成的底圖比較正常,操作動(dòng)作不要太夸張,就可以用。”從事游戲AI技術(shù)的陳星(化名)說。目前文生視頻模型還停留在“4秒時(shí)代”,陳星認(rèn)為,市面上的Pika、Runway等模型只能生成Gif圖(圖形交換格式)效果的內(nèi)容,這些只能用在游戲“稍微動(dòng)一點(diǎn)”的地方。
但涉及游戲較為核心的畫面則需要人工加入。陳星表示,目前Sora最多能生成一分鐘的視頻,比較理想的使用場景是,如果需要制作5至10分鐘的長CG(計(jì)算機(jī)生成圖像),需要通過不斷調(diào)整提示詞,生成一些較為滿意的片段和鏡頭,再通過人工的剪輯讓這些片段看起來“更連貫些”,但更有可能出現(xiàn)的情況是,很大部分片段無法直接使用,造成更大的成本和算力浪費(fèi)。
但陳星認(rèn)為,“生成式人工智能對獨(dú)立游戲的開發(fā)者和小工作室是利好的,以前獨(dú)立游戲里沒有的CG、過場動(dòng)畫和3D模型等,現(xiàn)在都可以有了。因?yàn)檫@些內(nèi)容是逐幀渲染出來的,非常耗時(shí)耗錢?!币杂螒騊V(游戲宣傳視頻)為例,一段高質(zhì)量的PV視頻起碼花費(fèi)數(shù)百萬元。
但從事游戲項(xiàng)目用戶增長的張青(化名)提示,如果在二次元、MMO(大型多人在線游戲)、SLG(策略類游戲)等強(qiáng)調(diào)美術(shù)和內(nèi)容質(zhì)量的游戲中,直接使用模型生成內(nèi)容容易招致玩家反感。他認(rèn)為,這類游戲如果使用模型生成內(nèi)容,“可能用在比較細(xì)微的地方,不太可能用在主線過場動(dòng)畫或主要宣傳的視頻,比如PV”。
據(jù)伽馬數(shù)據(jù)《中國游戲產(chǎn)業(yè)AIGC發(fā)展前景報(bào)告》,在中國游戲營收TOP50游戲企業(yè)中,已有64%的游戲企業(yè)明確布局AIGC領(lǐng)域,并有實(shí)質(zhì)性動(dòng)作。已布局企業(yè)中,有27家企業(yè)已將AIGC投入到了游戲研發(fā)、營銷、運(yùn)營等游戲產(chǎn)業(yè)全流程應(yīng)用層面;12家企業(yè)運(yùn)用AIGC相關(guān)技術(shù)為其他行業(yè)或企業(yè)提供解決方案;9家企業(yè)則選擇重點(diǎn)布局?jǐn)?shù)字人、元宇宙領(lǐng)域。
廣告行業(yè)
AIGC內(nèi)容可能會(huì)最早應(yīng)用在點(diǎn)擊付費(fèi)廣告上
農(nóng)夫山泉生肖龍AI繪畫小程序上線,20天吸引網(wǎng)友創(chuàng)作一百多萬張龍寶寶畫作;可口可樂“龍連你我”系列活動(dòng)用AI帶領(lǐng)百萬人沖擊吉尼斯挑戰(zhàn)……自AIGC問世以來,就已讓不少廣告人感到壓力,龍年開局的幾個(gè)優(yōu)秀傳播案例更是都用上了AI元素。
“每天早晨,我都會(huì)根據(jù)自己擬定的主題創(chuàng)作方向,用Midjunery、文心一格等軟件來訓(xùn)練圖片,直到生成6組滿意的(圖片),分發(fā)到視頻號、小紅書和抖音上。一年來運(yùn)營三個(gè)賬號的成本只有幾千元,這在以前是完全想不到的,此前為圖庫付費(fèi)都要幾萬甚至更多。”田海龍告訴新京報(bào)貝殼財(cái)經(jīng)記者。
田海龍此前是一家A股上市傳播機(jī)構(gòu)的設(shè)計(jì)創(chuàng)意總監(jiān),有近20年廣告設(shè)計(jì)經(jīng)驗(yàn)。從2023年開始嘗試用AIGC輔助創(chuàng)意設(shè)計(jì)工作。他孵化的“龍哥的AI實(shí)驗(yàn)室”賬號僅用10個(gè)月就獲得了“視頻號2023年度優(yōu)秀創(chuàng)作者”,訓(xùn)練生成的圖片作品入選國劇盛典、新華社活動(dòng),他自己也成了“文心一格”的核心訓(xùn)練師。
“目前國內(nèi)的專業(yè)文生圖模型經(jīng)歷了至少四次迭代。第一代模型輸出的圖片完全不具備圖片基本使用需求,也不符合我的審美。有天早晨,某款模型的產(chǎn)品人員提示我模型升級了,我用此前用過的提示詞試了一下,結(jié)果出來的圖片超出我的預(yù)期。但直到第三代模型出來之前,我都不敢用它訓(xùn)練人像圖片,因?yàn)椋P停θ讼竦奈骞贌o法正常表現(xiàn),理解誤差大,直到第三代模型專門針對人像進(jìn)行了優(yōu)化?!碧锖}堉钢謾C(jī)上他用不同版本模型訓(xùn)練出的圖片告訴記者。
田海龍這樣描述他使用過的國外和國內(nèi)文生圖模型的差異,“教育的環(huán)境、方法、師資的水平以及優(yōu)秀教師的數(shù)量都不在一個(gè)水平,結(jié)果導(dǎo)致不管是畫質(zhì)、細(xì)節(jié)、像素,還是畫幅、景深,國內(nèi)模型生成的圖都略遜于國外模型,但也能感受到國內(nèi)模型的進(jìn)步速度之快?!彼麄€(gè)人判斷是由于優(yōu)質(zhì)訓(xùn)練內(nèi)容和算力投入的不足,導(dǎo)致了中文模型的弱點(diǎn)。
經(jīng)過超10個(gè)月的深度使用,田海龍認(rèn)為AIGC生成的內(nèi)容目前尚無法實(shí)現(xiàn)高端客戶對定制和創(chuàng)新內(nèi)容的需求,因?yàn)槟壳暗哪P投际峭ㄓ眯?,還沒有針對廣告設(shè)計(jì)行業(yè)優(yōu)化訓(xùn)練的模型。
“但一些基礎(chǔ)需求,比如對品牌要求不高的提案設(shè)計(jì)稿、概念稿,以及傳播配圖、熱點(diǎn)海報(bào)等是可以滿足的。原本五人左右的團(tuán)隊(duì),現(xiàn)在會(huì)被一個(gè)人的‘超級個(gè)體’取代,尤其目前消費(fèi)降級,客戶對品牌調(diào)性的要求相對較低?!碧锖}堈f。此外,他認(rèn)為形成有個(gè)人特色的AIGC圖庫,出售圖片版權(quán),也是一種商業(yè)路徑。
海外獨(dú)立導(dǎo)演杜蘭馨也持類似觀點(diǎn),“比較大型的廣告公司才會(huì)做上百萬甚至上千萬的廣告。中小企業(yè)的商業(yè)視頻,10萬到20萬水平的廣告片,Sora的技術(shù)是可以達(dá)到?!?/p>
無法實(shí)現(xiàn)定制和創(chuàng)新的局限也體現(xiàn)在技術(shù)細(xì)節(jié)上。據(jù)公開信息,Sora的技術(shù)路線繼承了此前公開的DALL-E文生圖模型,有一定程度的創(chuàng)新,但并非顛覆性,因此當(dāng)下Sora不可能產(chǎn)生真正“原創(chuàng)性”的內(nèi)容,依然高度依賴人為調(diào)教。
受訪的不少從業(yè)者表示,AIGC內(nèi)容可能會(huì)最早應(yīng)用在CPC廣告上。“因?yàn)樗梢再|(zhì)量低,可以和產(chǎn)品沒那么貼合,只要來用戶量就行。”從事游戲項(xiàng)目用戶增長的張青說。
據(jù)介紹,在游戲行業(yè)CPC廣告投放大多交給外包公司。陳星表示,“如果未來AIGC模型上線了選區(qū)修改功能,就能直接在原素材上進(jìn)行修改,一直改出自己想要的效果”。張青判斷,在成本受限的情況下,公司可能傾向于選擇用AI生成相關(guān)廣告,而不再使用外包公司。
影視行業(yè)
AIGC內(nèi)容缺乏敘事性,只能作素材或前期預(yù)覽
在影視行業(yè)中,2月6日上線的古裝探案劇《大唐狄公案》中就用到了人工智能生成。第一集中,鏡頭從青磚古瓦的恢宏建筑掃過,展示了一座大型古代長安城全景,街道行人、亭臺樓閣、古體建筑都由AI生成。
劇集由優(yōu)酷和儒意影業(yè)等出品,AI技術(shù)由阿里大文娛研發(fā)。優(yōu)酷方面表示,使用AI生成長安城,主要原因是因?yàn)閲鴥?nèi)沒有完整的唐代長安城實(shí)景地,而傳統(tǒng)特效在畫面轉(zhuǎn)場的精度、流暢度方面也無法滿足劇組需求,而且拍攝時(shí)間很緊,劇組知道阿里大文娛的技術(shù)后,就決定采用這套方案。但記者注意到,該片中生成的長安城主要是大全景,細(xì)節(jié)特寫及人物較少。
此前優(yōu)酷的爆款劇《異人之下》則使用了AI數(shù)字人演員。阿里大文娛首席技術(shù)官鄭勇在此前接受新京報(bào)采訪時(shí)表示,相較傳統(tǒng)虛擬制作,通過自研AI技術(shù)打造的數(shù)字人厘里,在《異人之下》中降低了在建模、原畫等環(huán)節(jié)投入的成本和時(shí)間,也避免了對動(dòng)捕技術(shù)的依賴,讓制作成本降低了80%,效率提升40%,呈現(xiàn)效果也更趨近于真人拍攝。
此外,阿里大文娛還在研究一套針對特效影片的“預(yù)演”系統(tǒng),該系統(tǒng)受到漫威的啟發(fā),漫威在拍攝特效影片時(shí)會(huì)將電影最復(fù)雜的部分“預(yù)演”出來。
雖然已經(jīng)有局部應(yīng)用,但大多受訪的影視行業(yè)人士認(rèn)為,邏輯的連貫性、細(xì)節(jié)的可操作性以及敘事性,都會(huì)影響到AIGC在高質(zhì)量影視行業(yè)的應(yīng)用?!斑€不知道Sora生成一個(gè)視頻的周期是多久,也不知道視頻的分辨率、幀速率等指標(biāo)能達(dá)到什么程度,這些都需要正式公測才知道。目前來看,它會(huì)很適用于短視頻的制作,但要影響到對質(zhì)量、品質(zhì)有較高要求的影視行業(yè),還有很長路要走。”DNEG高級環(huán)境藝術(shù)家李建鋒表示。
“生成出來的視頻是類似于空鏡頭的比較萬能的鏡頭,最先替代的可能是純視頻素材提供網(wǎng)站,小團(tuán)隊(duì)、小作坊可能會(huì)用,廣告公司應(yīng)該還不會(huì)。對電影級別的視頻制作,最多就是導(dǎo)演拍攝前做輔助,不過因?yàn)閿⑹滦匀狈赡苓B這個(gè)都做不了,畢竟現(xiàn)在連比較成熟的文生圖都沒辦法完全取代故事版的地位,更不用說預(yù)覽了?!崩罱ㄤh說。
中國科普作協(xié)科學(xué)與影視融合專委會(huì)常務(wù)副主任林育智也在采訪中表達(dá)了類似觀點(diǎn)?!半娪皬膩聿皇呛唵蔚漠嬅婧吐曇舻慕M合,它是我們的情感共情與共鳴,是我們和這個(gè)社會(huì)的人文思辨,是一段脫離于這個(gè)世界的沉浸,這是AI無法取代的?!绷钟钦f。他此前曾任《獨(dú)行月球》《三體》《流浪地球2》等科幻作品的科學(xué)顧問。
展望
已經(jīng)實(shí)現(xiàn)指數(shù)級進(jìn)步,但仍無法取代現(xiàn)有行業(yè)
在被問及AIGC內(nèi)容距離滿足定制化需求、實(shí)現(xiàn)商業(yè)化還有哪些路要走時(shí),中國藝術(shù)科技研究所數(shù)字藝術(shù)部主任張宜春總結(jié)了三大方面。
其一在技術(shù)方面,雖然目前的AIGC工具能夠出現(xiàn)讓人較為滿意的結(jié)果,但是如果細(xì)摳目前AIGC工具所生成的圖片、視頻,總會(huì)在細(xì)節(jié)上看出一些脫離真實(shí)的小錯(cuò)誤。因此用作最終落地的產(chǎn)品,特別是要求精益求精的各個(gè)場景,依然不能完美滿足客戶的要求。其二來自于觀念,目前AIGC所生成的東西,尚沒有能夠擺脫人類已有認(rèn)知領(lǐng)域的桎梏,形成超越人類想象力邊界的新東西,更像是對人類已有經(jīng)驗(yàn)的整合和加工。即AIGC做的東西還不足以和現(xiàn)在的藝術(shù)創(chuàng)作觀念、格調(diào)相匹配。其三在設(shè)計(jì)和藝術(shù)層面,目前AIGC生成內(nèi)容的想象力和創(chuàng)造力,還沒有超越人類已有認(rèn)知,也就是缺乏那么一點(diǎn)點(diǎn)讓人產(chǎn)生震撼的“不同”,因此達(dá)不到藝術(shù)設(shè)計(jì)創(chuàng)作在實(shí)用中的效果。
但他表示,“隨著AIGC工具的不斷進(jìn)化,而且隨著使用工具者的人員規(guī)模和操作水平提升,目前所限制的三個(gè)條件,有可能在未來某個(gè)時(shí)間點(diǎn),不再成為障礙。畢竟,我們已經(jīng)看到很多人,在以文生圖的設(shè)計(jì)中,表現(xiàn)出了足夠的創(chuàng)造力,未來只是如何將這種個(gè)人的想象力轉(zhuǎn)化成實(shí)際的視覺結(jié)果,這也是AIGC正在做和未來也將要做的事情?!?/p>
中央財(cái)經(jīng)大學(xué)中國互聯(lián)網(wǎng)經(jīng)濟(jì)研究院副院長劉航研究員認(rèn)為,簡單利用Sora所生成的視頻未必真正符合行業(yè)的實(shí)際需求,需要技術(shù)人員找到與人工智能更有效的溝通與互動(dòng)方式,才能不斷縮小文生視頻技術(shù)與從業(yè)者需求之間的差距,“這實(shí)際對從業(yè)者在理解并掌握人工智能技術(shù)層面的能力提出了更高要求”。
游戲行業(yè)的陳星認(rèn)為目前的AIGC還不能滿足用戶對接續(xù)感的要求。“游戲不可能只短暫玩一下,玩家探索游戲世界需要很長時(shí)間,游戲世界中的每個(gè)地方也需要連接在一起。”他認(rèn)為,即使Sora的生成時(shí)長得到拓展,也存在所謂的上限,“依據(jù)我對算法的理解,生成內(nèi)容越長,算法對前面生成內(nèi)容的記憶越弱”。
成本也成為一大限制因素?!熬退鉙ora生成的視頻能夠用到游戲中,目前也需要通過3D建模、游戲引擎等拼接游戲片段以實(shí)現(xiàn)效果,這難免與‘節(jié)約成本’背離?!标愋钦f。
“游戲很多畫面需要實(shí)時(shí)生成,使用Sora實(shí)時(shí)生成游戲畫面將耗費(fèi)巨大的算力,如果是API(應(yīng)用程序接口)形式,價(jià)格會(huì)很貴,如果是模型推理按照目前的云端服務(wù)器來說,這對游戲廠商和普通玩家都是壓力,小廠商基本無法支撐?!标愋钦f。
面對AIGC內(nèi)容過多,可能會(huì)影響平臺的內(nèi)容質(zhì)量,造成虛擬和真實(shí)的難以區(qū)分,甚至?xí)砬謾?quán)風(fēng)險(xiǎn)和失業(yè)風(fēng)險(xiǎn)。張宜春建議,首先,所有AIGC的生成物,必須有人類可識別的標(biāo)識,表明其特性,避免理性上的誤導(dǎo)。其次,在AIGC的技術(shù)檢測方法上,工具創(chuàng)作者、使用者、發(fā)布者必須建立起嚴(yán)格的技術(shù)鏈條,統(tǒng)一完成人工內(nèi)容和AI生成內(nèi)容的檢測和甄別?!皩τ谛蜗竽7碌刃は駲?quán)的模仿,我覺得可以展開相關(guān)的法律制度和分配制度研究工作,建立其‘多方參與、各方受益、社會(huì)廣泛監(jiān)督、總體寬容、加強(qiáng)社會(huì)組織功能’的AIGC新生態(tài)?!睆堃舜赫f。
新京報(bào)首席記者 白金蕾 記者 韋英姿
編輯 張冰 校對 劉越