在Scaling Law(規(guī)模定律)推動下,國內(nèi)電信運營商亮出打造算力、數(shù)據(jù)兩張網(wǎng)絡(luò)的野心。
Scaling Law解釋了模型性能與計算量、模型參數(shù)量和數(shù)據(jù)大小三者之間的關(guān)系,盡管業(yè)界對它有所質(zhì)疑,但不可否認(rèn),當(dāng)前它仍指引著人工智能產(chǎn)業(yè)鏈的商業(yè)發(fā)展方向。
其中,在計算規(guī)模上,IDC曾預(yù)計,到2027年,中國智能算力規(guī)模將達(dá)1117.4 EFLOPS(每秒一百京次浮點運算)。數(shù)據(jù)量方面,根據(jù)艾瑞咨詢推算,2023年,中國AI(人工智能)基礎(chǔ)數(shù)據(jù)服務(wù)市場規(guī)模為45億元,預(yù)計2028年將達(dá)170億元。
龐大的市場需求催生電信運營商建設(shè)算力、數(shù)據(jù)網(wǎng)絡(luò)的野心。9月13日,在2024年中國國際服務(wù)貿(mào)易交易會的企業(yè)數(shù)字化轉(zhuǎn)型論壇及大模型應(yīng)用創(chuàng)新論壇上,與會嘉賓共同討論了數(shù)字技術(shù)如何賦能企業(yè)數(shù)字化轉(zhuǎn)型、國內(nèi)大模型應(yīng)用現(xiàn)狀與制約。其中,中國電信、中國移動、中國聯(lián)通等電信運營商代表展現(xiàn)了各自的算力、數(shù)據(jù)布局。
國產(chǎn)大模型數(shù)量超200個,國內(nèi)電信運營商積極部署萬卡集群
“百模大戰(zhàn)”后,國內(nèi)大模型落地開始加速。但工業(yè)和信息化部原黨組成員、總工程師田玉龍在大模型應(yīng)用創(chuàng)新論壇致辭中指出,大模型應(yīng)用滯后于其技術(shù)發(fā)展,應(yīng)用創(chuàng)新也面臨諸多挑戰(zhàn)?!爸饕苤朴诖竽P偷挠?xùn)練,需要海量的數(shù)據(jù)和強大的計算能力支持,數(shù)據(jù)瓶頸和算力不足仍然存在?!?/p>
據(jù)不完全統(tǒng)計,國產(chǎn)大模型數(shù)量目前已超過200個。國家互聯(lián)網(wǎng)信息辦公室最新公布數(shù)據(jù)顯示,截至今年3月,我國共有117個生成式人工智能服務(wù)完成備案。
工業(yè)和信息化部原黨組成員、總工程師田玉龍。主辦方供圖
2023年12月,國家發(fā)展改革委等五部門曾聯(lián)合發(fā)文要求加快構(gòu)建全國一體化算力網(wǎng),電信運營商順勢提出建設(shè)“算力網(wǎng)絡(luò)”——打通數(shù)據(jù)中心之間的網(wǎng)絡(luò)鏈接,讓算力像電力和網(wǎng)絡(luò)一樣統(tǒng)一調(diào)度資源。
“算力網(wǎng)絡(luò)是一種新型基礎(chǔ)設(shè)施。”在企業(yè)數(shù)字化轉(zhuǎn)型論壇上,中國聯(lián)合網(wǎng)絡(luò)通信集團(tuán)有限公司大數(shù)據(jù)首席科學(xué)家范濟(jì)安說道。具體來看,算力網(wǎng)絡(luò)要在云端、邊端按需分配計算、存儲、網(wǎng)絡(luò)這三種資源。范濟(jì)安表示,在云計算時期,這三種資源仍然獨立、分系統(tǒng)進(jìn)行調(diào)度,沒有一體化標(biāo)準(zhǔn)。“如何一體化靈活調(diào)度這三種資源,是算力網(wǎng)絡(luò)建設(shè)的主要挑戰(zhàn)?!绷硗猓凇皷|數(shù)西算”工程要求下,如何保證確定時延,也是挑戰(zhàn)之一。
目前,大模型的算力需求主要集中在訓(xùn)練層,隨著應(yīng)用深入,在重要節(jié)點或邊緣側(cè)、應(yīng)用側(cè)的推理也對分布式算力提出調(diào)度要求。
對此,中國聯(lián)通、中國移動、中國電信等國內(nèi)電信運營商搭建起通算、智算、超算等一體化算力平臺。其中,中國電信“息壤”平臺的各類智算能力合計22EFLOPS;中國移動“百川”平臺算力超3.3EFLOPS;中國聯(lián)通“星羅”可調(diào)動近500個算力資源池。
中國聯(lián)合網(wǎng)絡(luò)通信集團(tuán)有限公司大數(shù)據(jù)首席科學(xué)家范濟(jì)安。新京報貝殼財經(jīng)記者 韋英姿 攝
另外,電信運營商還積極加入萬卡建設(shè)“大軍”。中國移動今年將商用哈爾濱、呼和浩特、貴陽三個萬卡集群;中國聯(lián)通建設(shè)上海臨港、呼和浩特等萬卡智算中心;中國電信天翼云上海臨港國產(chǎn)萬卡算力池已正式啟用。
根據(jù)上述三家電信運營商2024年中期報告,中國移動通用算力規(guī)模達(dá)8.2EFLOPS,智能算力規(guī)模達(dá)19.6EFLOPS;中國電信推理池的智能算力累計21EFLOPS;中國聯(lián)通全網(wǎng)智算算力達(dá)10EFLOPS。
打造數(shù)據(jù)網(wǎng)絡(luò)有望解決數(shù)據(jù)集質(zhì)量問題
高質(zhì)量數(shù)據(jù)集的獲取與標(biāo)注掣肘人工智能發(fā)展。在中國電信集團(tuán)科技創(chuàng)新部副總經(jīng)理陳靖翔看來,將依靠人工處理的數(shù)據(jù)集放到數(shù)據(jù)智能中臺上,通過工具處理能夠大幅提高數(shù)據(jù)運營效率。
中國電信集團(tuán)科技創(chuàng)新部副總經(jīng)理陳靖翔。新京報貝殼財經(jīng)記者 韋英姿 攝
中國移動通信集團(tuán)信息技術(shù)中心、大數(shù)據(jù)BG總經(jīng)理王翼彬表示,通過數(shù)據(jù)網(wǎng)絡(luò)平臺,能夠讓數(shù)據(jù)供需雙方發(fā)現(xiàn)彼此,進(jìn)行數(shù)據(jù)共享、共同建模。他也希望,數(shù)據(jù)網(wǎng)絡(luò)能夠解決高質(zhì)量數(shù)據(jù)和人工智能模型訓(xùn)練之間的傳輸問題。
王翼彬認(rèn)為,數(shù)據(jù)網(wǎng)絡(luò)能夠幫助國內(nèi)數(shù)據(jù)交易中心盈利。據(jù)他透露,中國移動的數(shù)聯(lián)網(wǎng),已經(jīng)與鄭州數(shù)據(jù)交易中心、貴陽數(shù)據(jù)交易所等4家數(shù)據(jù)交易所合作,每月交付量大約在1億條以上。
打通數(shù)據(jù)網(wǎng)絡(luò)是為了推動數(shù)據(jù)共享,如何建立數(shù)據(jù)共享新模式?
范濟(jì)安認(rèn)為,可以遵循業(yè)務(wù)邏輯,“數(shù)據(jù)互聯(lián)往往是同一條產(chǎn)業(yè)鏈的上下游企業(yè)”。他還提出,可以通過跨界融合的方式共享數(shù)據(jù),這“可能出現(xiàn)‘1+1>2’的商機”。另外,還可以通過設(shè)立碳排放、綠色金融、ESG等監(jiān)管類政策要求企業(yè)跨行業(yè)融合、加工、處理和應(yīng)用數(shù)據(jù)。
業(yè)界尚未形成數(shù)據(jù)共享的統(tǒng)一標(biāo)準(zhǔn)或技術(shù)路線。范濟(jì)安認(rèn)為,區(qū)塊鏈技術(shù)是較為可行的辦法,它能夠在增強數(shù)據(jù)安全、保護(hù)隱私的同時,做到去中心化的數(shù)據(jù)流通、共享。
王翼彬則提出隱私計算的方式。他以金融領(lǐng)域為例說明,隱私計算能夠做到數(shù)據(jù)不出域,同時讓模型挖掘數(shù)據(jù)價值。但他也強調(diào),隱私計算還未形成一套標(biāo)準(zhǔn)體系?!邦A(yù)計未來會出現(xiàn)(標(biāo)準(zhǔn)化體系),否則很難形成集約化發(fā)展?!?/p>
中國移動通信集團(tuán)信息技術(shù)中心、大數(shù)據(jù)BG總經(jīng)理王翼彬。新京報貝殼財經(jīng)記者 韋英姿 攝
近年來,中國移動、中國電信、中國聯(lián)通數(shù)字化相關(guān)業(yè)務(wù)保持快速增長。今年上半年,中國電信產(chǎn)業(yè)數(shù)字化服務(wù)收入737億元,同比增長7.2%。中國移動數(shù)字化轉(zhuǎn)型收入達(dá)1471億元,同比增長11%。中國聯(lián)通算網(wǎng)數(shù)智業(yè)務(wù)收入435億元,同比增長6.6%。
其中,天翼云收入達(dá)552億元,同比增長20.4%;移動云收入504億元,同比增長19.3%;聯(lián)通云收入317億元,同比增長24.3%。
新京報貝殼財經(jīng)記者 韋英姿
編輯 岳彩周
校對 吳興發(fā)