新京報貝殼財經(jīng)訊(記者羅亦丹)記者9月10日獲悉,“清華系”AI公司生數(shù)科技旗下視頻大模型Vidu正式推出Vidu Q1參考生圖功能,以支持7張參考圖輸入打破國內(nèi)生成上限,并在一致性、還原度等關鍵指標上正面對標最近爆火的Nano Banana。
生數(shù)科技方面表示,從單圖參考到多圖參考,是AI生圖在一致性上的不斷突破,“可以說沒有一致性,就沒有大規(guī)模商業(yè)化應用?!辈煌趩螆D參考的單一限定條件,Vidu Q1參考生圖可以指定人物、場景、道具進行自由創(chuàng)作,通過多個參考對象實現(xiàn)對畫面的更強可控。
如下圖的“讓萊昂納多坐在霍格沃茨學院的教室里練習魔法?!陛斎氲亩鄰垍⒖紙D中包含了人物、道具、服飾、配飾等多個主體,場景非常復雜。
從輸出的結(jié)果來看,Vidu Q1參考生圖嚴格遵循提示詞,人物發(fā)型、五官均保持與原圖一致,每個物品位置擺放正確,且比例合理。左側(cè)亮起的臺燈照亮了萊昂納多的側(cè)臉和桌面上攤開的書本,寵物海德薇站在紅色行李箱上毫無違和感,多個主體的融合高度一致。
生數(shù)科技方面表示,作為Vidu首款參考生圖產(chǎn)品,Vidu Q1一經(jīng)推出便實現(xiàn)對谷歌Nano Banana的全面對標,在AI生圖這一巨頭云集的賽道中展現(xiàn)出中國創(chuàng)業(yè)公司的硬核技術實力。Vidu Q1參考生圖的發(fā)布,是中國AI多模態(tài)領域的一次重要突破。它證明了中國團隊不僅能夠緊跟國際發(fā)展,更能在關鍵技術上實現(xiàn)差異化創(chuàng)新甚至局部超越。
校對 穆祥桐