圖/IC
北京時(shí)間3月1日中午,DeepSeek于“開源周”收官之際在知乎發(fā)文,不僅解讀了關(guān)鍵的降本增效技術(shù),還首次公開了API服務(wù)的成本、收入以及理論上高達(dá)545%的利潤率。不過,這也意外引發(fā)了兩家為用戶提供DeepSeek服務(wù)的MaaS供應(yīng)商“互懟”,讓國內(nèi)AI Infra(人工智能基礎(chǔ)設(shè)施)企業(yè)罕見成為“吃瓜大戲”的主角。
MaaS,直譯為模型即服務(wù),指將模型部署到企業(yè)端提供給用戶服務(wù)。春節(jié)期間DeepSeek“服務(wù)器繁忙”時(shí),不少從事MaaS服務(wù)的大模型基礎(chǔ)設(shè)施公司,如潞晨科技、硅基流動(dòng)等為用戶提供了使用“滿血版”DeepSeek的機(jī)會(huì)。
對(duì)于該項(xiàng)服務(wù),潞晨科技創(chuàng)始人尤洋曾公開發(fā)文表示“MaaS模式下用戶越多虧損越多”,而隨著DeepSeek公開成本和利潤率,面對(duì)網(wǎng)友質(zhì)疑,尤洋發(fā)文反駁并一度“辣評(píng)”競對(duì)公司硅基流動(dòng),最終和硅基流動(dòng)創(chuàng)始人袁進(jìn)輝開始“互懟”。此后,更延展到此前潞晨科技涉及的抄襲風(fēng)波上,引來了更多圈內(nèi)人士“下場”。
對(duì)此,中存算董事長陳巍評(píng)價(jià)道:“創(chuàng)業(yè)不易,創(chuàng)新不易,需要多一點(diǎn)寬容。技術(shù)上偶爾出現(xiàn)判斷偏差都很正常。”而對(duì)于究竟DeepSeek的MaaS服務(wù)“虧不虧”這一問題,陳巍對(duì)新京報(bào)貝殼財(cái)經(jīng)記者表示,“這個(gè)問題已經(jīng)超出純技術(shù)討論范疇了,涉及產(chǎn)品定位和AI Infra企業(yè)的求生。建議雙方擱置爭議,抓緊時(shí)間做Infra優(yōu)化,搶占用戶日活攀升的產(chǎn)業(yè)窗口期?!?/p>
DeepSeek展示盈利能力:一天收入56.2萬美元,理論成本利潤率545%
事件發(fā)生在DeepSeek的“開源周”行將結(jié)束之際——此前,DeepSeek曾表示將在從2月24日開始的“開源周”發(fā)布五項(xiàng)開源成果,但當(dāng)五項(xiàng)成果全部發(fā)布結(jié)束后的第六天,DeepSeek又發(fā)布了《DeepSeek-V3/R1推理系統(tǒng)概覽》技術(shù)文章,首次公布了模型推理系統(tǒng)降本增效的優(yōu)化細(xì)節(jié)。
該篇文章以DeepSeek推理系統(tǒng)的優(yōu)化目標(biāo):更大的吞吐,更低的延遲為核心,詳細(xì)介紹了其解決方案:使用大規(guī)??绻?jié)點(diǎn)專家并行(Expert Parallelism / EP)。以通俗的方式來理解,就類似把AI模型拆分成多個(gè)“小專家”,分散到不同的顯卡(GPU)上運(yùn)行。就像餐館里多個(gè)廚師同時(shí)備菜,每個(gè)廚師只負(fù)責(zé)自己最擅長的部分,整體出餐速度更快。V3系統(tǒng)中,每層有256個(gè)專家,但每次只用8個(gè),通過動(dòng)態(tài)分配實(shí)現(xiàn)高效計(jì)算。
此外,當(dāng)不同顯卡之間需要傳遞數(shù)據(jù)時(shí),系統(tǒng)會(huì)像工廠流水線一樣,讓計(jì)算和傳輸同時(shí)進(jìn)行。例如在生成文字時(shí),前一部分還在計(jì)算,后一部分已經(jīng)開始傳輸,避免“干等”浪費(fèi)時(shí)間。
對(duì)此,袁進(jìn)輝評(píng)論道,“DeepSeek官方披露大規(guī)模部署成本和收益,又一次顛覆了很多人的認(rèn)知?,F(xiàn)在很多供應(yīng)商還做不到這個(gè)水平,主要是V3/R1架構(gòu)和其他主流模型差別太大了,由大量小Expert(專家)組成,導(dǎo)致瞄準(zhǔn)其他主流模型結(jié)構(gòu)開發(fā)的系統(tǒng)都不再有效,必須按照DeepSeek報(bào)告描述的方法才能達(dá)到最好的效率,而開發(fā)這樣的系統(tǒng)難度很高,需要時(shí)間,幸好這周DeepSeek五連發(fā)已經(jīng)把主要模塊開源出來了,降低了社區(qū)復(fù)現(xiàn)的難度?!?/p>
一個(gè)可以讓人直觀感受DeepSeek效率的數(shù)據(jù)是,其在文章最后展示了以2月27日12:00至2月28日12:00,一天內(nèi)DeepSeek V3和 R1推理服務(wù)占用的節(jié)點(diǎn),并統(tǒng)計(jì)了包括網(wǎng)頁、APP和API的所有負(fù)載,推算發(fā)現(xiàn)假定GPU租賃成本為2美元/小時(shí),總成本為 8.7萬美元,若所消耗的tokens(算力計(jì)價(jià)單位)全部按照DeepSeek R1的API定價(jià)計(jì)算,理論上一天的總收入為56.2萬美元,成本利潤率為545%。
DeepSeek在知乎的文章中披露了其推算的成本、理論收入和利潤率 圖片來源:知乎截圖
“這份成本利潤披露看似坦誠,實(shí)則暗藏殺機(jī)。它告訴所有人:大模型的游戲規(guī)則早已變了,單靠算法或者簡單囤積算力不能贏得大模型的勝利。在算法+數(shù)據(jù)+算力的三要素中,有效算力(算力x算力效率)才是最暴力美學(xué)的生存規(guī)則,唯快不破這個(gè)道理也適用于大模型行業(yè)。這份數(shù)據(jù)事實(shí)上是三頭六臂‘大鬧東海,腳踢很白的宮’的技術(shù)演繹,也是‘算力+智力’逆風(fēng)翻盤的真實(shí)寫照?!标愇”硎?。
值得注意的是,此前DeepSeek的重要信息發(fā)布一般在X、GitHub等以英文為主的平臺(tái),而本次的發(fā)布還額外登錄了知乎,這瞬間引發(fā)了國內(nèi)AI圈的熱情,截至3月3日早,DeepSeek發(fā)布的文章在知乎獲得了7735個(gè)贊,以及866條評(píng)論。
尤洋遭網(wǎng)友“點(diǎn)名” DeepSeek API服務(wù)到底“虧不虧”?
新京報(bào)貝殼財(cái)經(jīng)記者注意到,不少網(wǎng)友本著“看熱鬧不嫌事大”的心態(tài)在這篇文章的評(píng)論區(qū)里“呼叫尤洋”,其中一條@尤洋知乎賬號(hào)的評(píng)論獲得了475個(gè)點(diǎn)贊,點(diǎn)贊數(shù)為評(píng)論區(qū)第二高。
這是因?yàn)?,此前尤洋曾發(fā)文直言“MaaS在中國短時(shí)間內(nèi)可能是最差的商業(yè)模式”“滿血版DeepSeek R1每日輸出1000億tokens,那么每個(gè)月虧損4億”,引發(fā)了業(yè)界對(duì)MaaS商業(yè)模式的爭論。
潞晨科技創(chuàng)始人尤洋微博截圖
AI與云基礎(chǔ)設(shè)施專家左鵬飛表示,DeepSeek和尤洋之間觀點(diǎn)沖突的主要原因是對(duì)每臺(tái)H800機(jī)器能跑出多大吞吐量的認(rèn)知不同。
“根據(jù)尤洋老師的采訪視頻,4臺(tái)機(jī)器跑出的吞吐量是1K tokens/s,而DeepSeek官方跑出的數(shù)據(jù)是平均每臺(tái)機(jī)器14.8K tokens/s, 有14.8*4 ≈ 59倍的性能差距。不同MaaS服務(wù)提供商對(duì)相同機(jī)器上相同模型跑出來的吞吐量可以相差59倍,那么自然有的MaaS服務(wù)商能掙錢,有的MaaS服務(wù)商大虧錢。這也證明AI Infra的系統(tǒng)優(yōu)化能力是多么重要?!弊簌i飛說。
對(duì)于網(wǎng)友的“點(diǎn)名”,尤洋本人也發(fā)文進(jìn)行了回應(yīng),他認(rèn)為DeepSeek文章中的數(shù)據(jù)對(duì)計(jì)算MaaS成本沒有太多參考價(jià)值,因?yàn)槲恼掳袲eepSeek網(wǎng)頁,APP和MaaS API的token數(shù)加在一起計(jì)算,且數(shù)據(jù)是建立在大量用戶把DeepSeek的APP和網(wǎng)頁完全超負(fù)荷占滿的情況下,不是一個(gè)常規(guī)的MaaS。
貝殼財(cái)經(jīng)記者發(fā)現(xiàn),DeepSeek提到的545%利潤率更多指的是“理想情況”,DeepSeek在官方文章里也表示“當(dāng)然我們實(shí)際上沒有這么多收入,因?yàn)閂3的定價(jià)更低,同時(shí)收費(fèi)服務(wù)只占了一部分,另外夜間還會(huì)有折扣?!?/p>
尤洋強(qiáng)調(diào),自己對(duì)DeepSeek的模型能力沒有貶低,但其使用體驗(yàn)非常差,“我春節(jié)期間用過幾次,問一個(gè)問題,然后說繁忙,讓我稍后嘗試,我等了15分鐘或者一小時(shí)。這不是一個(gè)合格的MaaS產(chǎn)品。”
似乎為了證明自己的觀點(diǎn),尤洋在發(fā)布完回應(yīng)文章后,宣布潞晨科技將在一周后停止提供DeepSeek的API服務(wù),
潞晨科技公眾號(hào)截圖
對(duì)此,左鵬飛告訴新京報(bào)貝殼財(cái)經(jīng)記者,尤洋的觀點(diǎn)有一定的道理,但“即使考慮上資源預(yù)留,也就是545%的利潤率除以2或3,依然是盈利的,不影響我提到的核心邏輯?!?/p>
兩家MaaS供應(yīng)商開吵“嘴架” 引出抄襲“舊賬”
這一事情的發(fā)展開始逐漸“跑偏”。尤洋在回復(fù)網(wǎng)友后,又在知乎發(fā)文,矛頭直指春節(jié)期間最早開始承接DeepSeek流量,為用戶提供“滿血版DeepSeek服務(wù)”的硅基流動(dòng),認(rèn)為該公司“犧牲員工春節(jié)假期捆綁華為宣傳、在小紅書拉人頭、API速度慢”等。
對(duì)此,袁進(jìn)輝在朋友圈反擊稱“我們團(tuán)隊(duì)愿意拼搏抓一個(gè)機(jī)會(huì)有什么錯(cuò)?邀請(qǐng)用戶送點(diǎn)免費(fèi)券有什么錯(cuò)?春節(jié)那幾天,全民都想訪問DeepSeek而不得時(shí),我們提供了僅有的一個(gè)穩(wěn)定的服務(wù)?!蓖瑫r(shí),他還提到了此前潞晨科技曾抄襲過硅基流動(dòng)。
這導(dǎo)致更多AI圈人士被牽涉進(jìn)來,如尤洋提到該起抄襲事件代碼的負(fù)責(zé)人是原潞晨科技CTO方佳瑞,但后者發(fā)長文回應(yīng)了自己的“背鍋”經(jīng)歷,表示代碼在自己入職之前就已存在。
此外,橘皮優(yōu)團(tuán)隊(duì)在2024年11月發(fā)布的對(duì)潞晨科技的公開信也被挖出,該公開信提到,“潞晨云算力云平臺(tái)公然抄襲我們的業(yè)務(wù)模式和機(jī)主協(xié)議,侵犯了知識(shí)產(chǎn)權(quán)。”袁進(jìn)輝轉(zhuǎn)發(fā)了該公開信并配文稱:“不是一次抄襲,多次發(fā)生。”
貝殼財(cái)經(jīng)記者注意到,雖然潞晨科技和硅基流動(dòng)彼此指責(zé),但二者都曾和華為云合作,為用戶推出基于國產(chǎn)算力的DeepSeek服務(wù),而在DeepSeek公布開源方案之后,這些AI Infra企業(yè)能否復(fù)現(xiàn)DeepSeek的技術(shù)細(xì)節(jié),從中攤薄成本,就成了考驗(yàn)企業(yè)技術(shù)實(shí)力的時(shí)候。
值得注意的是,雖然DeepSeek在過去一周中開源了多個(gè)代碼庫,但大多數(shù)是針對(duì)英偉達(dá)芯片架構(gòu)的。對(duì)此,有開發(fā)者告訴貝殼財(cái)經(jīng)記者,這些開源成果無法直接用在華為云的推理服務(wù)中,但其思想可以借鑒。
當(dāng)前,DeepSeek的成本透明化如同一面鏡子,映照出了AI Infra企業(yè)的理想與現(xiàn)實(shí),如何更好地借鑒DeepSeek的解決方案,控制企業(yè)成本,或許才是“破局”的鑰匙,畢竟545%的理想利潤率已經(jīng)被DeepSeek“點(diǎn)出”。
當(dāng)技術(shù)紅利逐漸消退,AI Infra企業(yè)需回答更本質(zhì)的問題:是繼續(xù)內(nèi)卷于算力租賃的價(jià)格戰(zhàn),還是以模型優(yōu)化、場景深耕和生態(tài)整合構(gòu)建真正的壁壘?這場爭議或許只是序幕,行業(yè)的生存法則正在被重新書寫。
記者聯(lián)系郵箱:luoyidan@xjbnews.com
新京報(bào)貝殼財(cái)經(jīng)記者 羅亦丹
編輯 王進(jìn)雨
校對(duì) 柳寶慶