4月18日,火山引擎在其舉辦的“原動力大會”上發(fā)布自研DPU(數(shù)據(jù)處理器)等系列云產(chǎn)品,并推出新版機器學習平臺:支持萬卡級大模型訓練、微秒級延遲網(wǎng)絡,讓大模型訓練更穩(wěn)更快。火山引擎總裁譚待稱,AI(人工智能)大模型有巨大潛力和創(chuàng)新空間,火山引擎會服務客戶做好大模型,共同推動各行業(yè)的智能化升級。
會上,火山引擎宣布與字節(jié)跳動國內(nèi)業(yè)務并池?;趦?nèi)外統(tǒng)一的云原生基礎架構,抖音等業(yè)務的空閑計算資源可極速調(diào)度給火山引擎客戶使用,離線業(yè)務資源分鐘級調(diào)度10萬核CPU(中央處理器),在線業(yè)務資源也可潮汐復用,彈性計算搶占式實例的價格最高可優(yōu)惠80%以上。
火山引擎還推出了分布式云原生平臺、多云安全、多云CDN(內(nèi)容分發(fā)網(wǎng)絡)、混合云平臺“veStack”等系列產(chǎn)品,支持客戶更好地使用多家云服務?!白止?jié)跳動用過全球幾乎每一朵公有云,以及大多數(shù)CDN,形成一套完整的分布式云管理體系和架構實踐”,譚待堅信火山引擎是最懂多云和分布式云的云服務商,這些技術能力都會毫無保留地提供給客戶。
如何讓大模型訓練快速“跑”起來?
自2022年底發(fā)布以來,ChatGPT(一款對話類人工智能應用)成為人類歷史上最快獲得上億用戶的消費級互聯(lián)網(wǎng)應用。最新的GPT-4大模型,在法律、數(shù)學、生物學等多項測試中超過90%人類。
譚待認為,國內(nèi)很多科技公司投入到大模型建設中,他們有優(yōu)秀的技術團隊,也有豐富的行業(yè)知識和創(chuàng)新想法,但往往缺乏經(jīng)過大規(guī)模場景實踐的系統(tǒng)工程能力?;鹕揭嬉龅木褪菫榇竽P涂蛻籼峁└叻€(wěn)定性和高性價比的AI基礎設施。

字節(jié)跳動副總裁楊震原分享抖音的機器學習實踐。圖|受訪者供圖
此前火山引擎機器學習平臺經(jīng)過抖音等海量用戶業(yè)務長期打磨,字節(jié)跳動副總裁楊震原認為,業(yè)務創(chuàng)新需要試錯,但試錯也一定要控制成本。通過潮汐、混部等方式,火山引擎實現(xiàn)資源的高利用率和極低成本。以抖音推薦系統(tǒng)為例,工程師用15個月的樣本訓練某個模型,5小時就能完成訓練,成本只有5000元?;鸨W(wǎng)的抖音“AI繪畫”特效,從啟動到上線只用一周多時間,模型由一名算法工程師完成訓練。
MiniMax(一家國內(nèi)人工智能企業(yè))是目前國內(nèi)少數(shù)已經(jīng)推出自研大模型產(chǎn)品的AI技術公司,擁有文本、視覺、聲音三種通用大模型引擎能力。據(jù)MiniMax聯(lián)合創(chuàng)始人楊斌介紹,MiniMax與火山引擎合作建立了超大規(guī)模實驗平臺,實現(xiàn)千卡級態(tài)化訓練;超大規(guī)模推理平臺有萬卡級算力池,支撐單日過億次調(diào)用。在火山引擎的云上,MiniMax大模型業(yè)務實現(xiàn)快速突破。
譚待透露,火山引擎的大模型云平臺獲得智譜AI、昆侖萬維等眾多企業(yè)的良好反饋,國內(nèi)大模型領域,七成以上已是火山引擎客戶。
大模型是云廠商彎道超車機會?
有評論稱,大模型將成為云廠商彎道超車的機會。譚待對此稱,大模型還在發(fā)展初期,面臨數(shù)據(jù)安全、內(nèi)容安全、隱私保護、版權保護等許多問題需要努力解決。但可以預見,大模型將帶動云上AI算力急劇增長,AI算力的工作負載與通用算力的差距會越來越小,這會為各家云廠商帶來新的機會,同時也會對數(shù)據(jù)中心、軟硬件棧、PaaS(平臺即服務)平臺帶來新的挑戰(zhàn)。

火山引擎總裁譚待宣布支持“多云多模型”的未來架構。圖|受訪者供圖
以數(shù)據(jù)中心的算力結構為例,譚待表示:“大模型需要大算力,虛擬化會帶來資源損耗,規(guī)模越大就損耗越多。未來3年內(nèi),大規(guī)模的算力中心,都將形成‘CPU(中心處理器)+GPU(圖形處理器)+DPU(數(shù)據(jù)處理器)’的混合算力結構,CPU負責通用計算,GPU負責AI計算,DPU負責資源卸載、加速和隔離,提升資源效率”。
此次原動力大會上,火山引擎發(fā)布了新一代自研DPU,實現(xiàn)計算、存儲、網(wǎng)絡的全組件卸載,釋放更多資源給業(yè)務負載?;鹕揭姹M管是“最年輕”的云廠商,其自研DPU已達到業(yè)界領先水平,網(wǎng)絡性能高達5000萬pps轉發(fā)能力、延遲低至20us?;谧匝蠨PU的各類計算實例性能也有顯著提升,例如適用于大模型分布式并行訓練場景的GPU實例,相較上一代實例集群性能最高提升3倍以上。
自動駕駛公司毫末智行與火山引擎合作打造智算中心,為DriveGPT(自動駕駛生成式模型)自動駕駛生成式預訓練模型提供強大的算力支持。毫末智行CEO顧維灝介紹,DriveGPT使用量產(chǎn)車4000萬公里的人駕數(shù)據(jù)訓練,參數(shù)規(guī)模達1200億,對自動駕駛認知決策模型進行持續(xù)優(yōu)化。
譚待表示,在大模型及下游應用發(fā)展推動下,無論傳統(tǒng)企業(yè)還是初創(chuàng)企業(yè),對AI算力都有迫切需求,企業(yè)使用多家云服務將成為常態(tài)。同時,各行業(yè)有自己高質(zhì)量的私有語料,大模型不會一家獨大,而是會在千行百業(yè)生長,形成多模型共生甚至協(xié)作的生態(tài)?!拔磥韺⑹恰嘣贫嗄P汀臅r代”,譚待稱。
會上,火山引擎還推出了分布式云原生平臺、多云安全、多云CDN(內(nèi)容分發(fā)網(wǎng)絡)、veStack混合云平臺等系列產(chǎn)品,支持客戶更好地使用多家云服務。“字節(jié)跳動用過全球幾乎每一朵公有云,以及大多數(shù)CDN,形成一套完整的分布式云管理體系和架構實踐”,譚待堅信火山引擎是最懂多云和分布式云的云服務商,這些技術能力都會毫無保留地提供給客戶。
楊震原進一步表示,火山引擎對內(nèi)對外提供統(tǒng)一的產(chǎn)品,抖音、今日頭條等APP開屏都加上了“火山引擎提供計算服務”。楊震原說:“數(shù)字化時代,機器學習可以智能、高效地圍繞目標解決問題。數(shù)字化的下一步是智能化,我們在機器學習方面的技術積累和經(jīng)驗,都會通過火山引擎提供給外部客戶,幫助更多企業(yè)做好智能化”。
新京報貝殼財經(jīng)記者 白金蕾
編輯 徐超
校對 王心