首頁 > 科技

DeepSeek公開利潤引服務(wù)商互懟 AI基建如何降本

2025-03-03 22:15:41 記者：羅亦丹編輯：王進(jìn)雨

DeepSeek API服務(wù)到底“虧不虧”？

圖/IC

北京時(shí)間3月1日中午，DeepSeek于“開源周”收官之際在知乎發(fā)文，不僅解讀了關(guān)鍵的降本增效技術(shù)，還首次公開了API服務(wù)的成本、收入以及理論上高達(dá)545%的利潤率。不過，這也意外引發(fā)了兩家為用戶提供DeepSeek服務(wù)的MaaS供應(yīng)商“互懟”，讓國內(nèi)AI Infra（人工智能基礎(chǔ)設(shè)施）企業(yè)罕見成為“吃瓜大戲”的主角。

MaaS，直譯為模型即服務(wù)，指將模型部署到企業(yè)端提供給用戶服務(wù)。春節(jié)期間DeepSeek“服務(wù)器繁忙”時(shí)，不少從事MaaS服務(wù)的大模型基礎(chǔ)設(shè)施公司，如潞晨科技、硅基流動(dòng)等為用戶提供了使用“滿血版”DeepSeek的機(jī)會(huì)。

對(duì)于該項(xiàng)服務(wù)，潞晨科技創(chuàng)始人尤洋曾公開發(fā)文表示“MaaS模式下用戶越多虧損越多”，而隨著DeepSeek公開成本和利潤率，面對(duì)網(wǎng)友質(zhì)疑，尤洋發(fā)文反駁并一度“辣評(píng)”競對(duì)公司硅基流動(dòng)，最終和硅基流動(dòng)創(chuàng)始人袁進(jìn)輝開始“互懟”。此后，更延展到此前潞晨科技涉及的抄襲風(fēng)波上，引來了更多圈內(nèi)人士“下場”。

對(duì)此，中存算董事長陳巍評(píng)價(jià)道：“創(chuàng)業(yè)不易，創(chuàng)新不易，需要多一點(diǎn)寬容。技術(shù)上偶爾出現(xiàn)判斷偏差都很正常。”而對(duì)于究竟DeepSeek的MaaS服務(wù)“虧不虧”這一問題，陳巍對(duì)新京報(bào)貝殼財(cái)經(jīng)記者表示，“這個(gè)問題已經(jīng)超出純技術(shù)討論范疇了，涉及產(chǎn)品定位和AI Infra企業(yè)的求生。建議雙方擱置爭議，抓緊時(shí)間做Infra優(yōu)化，搶占用戶日活攀升的產(chǎn)業(yè)窗口期?！?/p>

DeepSeek展示盈利能力：一天收入56.2萬美元，理論成本利潤率545%

事件發(fā)生在DeepSeek的“開源周”行將結(jié)束之際——此前，DeepSeek曾表示將在從2月24日開始的“開源周”發(fā)布五項(xiàng)開源成果，但當(dāng)五項(xiàng)成果全部發(fā)布結(jié)束后的第六天，DeepSeek又發(fā)布了《DeepSeek-V3/R1推理系統(tǒng)概覽》技術(shù)文章，首次公布了模型推理系統(tǒng)降本增效的優(yōu)化細(xì)節(jié)。

該篇文章以DeepSeek推理系統(tǒng)的優(yōu)化目標(biāo)：更大的吞吐，更低的延遲為核心，詳細(xì)介紹了其解決方案：使用大規(guī)?？绻?jié)點(diǎn)專家并行（Expert Parallelism / EP）。以通俗的方式來理解，就類似把AI模型拆分成多個(gè)“小專家”，分散到不同的顯卡（GPU）上運(yùn)行。就像餐館里多個(gè)廚師同時(shí)備菜，每個(gè)廚師只負(fù)責(zé)自己最擅長的部分，整體出餐速度更快。V3系統(tǒng)中，每層有256個(gè)專家，但每次只用8個(gè)，通過動(dòng)態(tài)分配實(shí)現(xiàn)高效計(jì)算。

此外，當(dāng)不同顯卡之間需要傳遞數(shù)據(jù)時(shí)，系統(tǒng)會(huì)像工廠流水線一樣，讓計(jì)算和傳輸同時(shí)進(jìn)行。例如在生成文字時(shí)，前一部分還在計(jì)算，后一部分已經(jīng)開始傳輸，避免“干等”浪費(fèi)時(shí)間。

對(duì)此，袁進(jìn)輝評(píng)論道，“DeepSeek官方披露大規(guī)模部署成本和收益，又一次顛覆了很多人的認(rèn)知?，F(xiàn)在很多供應(yīng)商還做不到這個(gè)水平，主要是V3/R1架構(gòu)和其他主流模型差別太大了，由大量小Expert（專家）組成，導(dǎo)致瞄準(zhǔn)其他主流模型結(jié)構(gòu)開發(fā)的系統(tǒng)都不再有效，必須按照DeepSeek報(bào)告描述的方法才能達(dá)到最好的效率，而開發(fā)這樣的系統(tǒng)難度很高，需要時(shí)間，幸好這周DeepSeek五連發(fā)已經(jīng)把主要模塊開源出來了，降低了社區(qū)復(fù)現(xiàn)的難度?！?/p>

一個(gè)可以讓人直觀感受DeepSeek效率的數(shù)據(jù)是，其在文章最后展示了以2月27日12:00至2月28日12:00，一天內(nèi)DeepSeek V3和 R1推理服務(wù)占用的節(jié)點(diǎn)，并統(tǒng)計(jì)了包括網(wǎng)頁、APP和API的所有負(fù)載，推算發(fā)現(xiàn)假定GPU租賃成本為2美元/小時(shí)，總成本為 8.7萬美元，若所消耗的tokens（算力計(jì)價(jià)單位）全部按照DeepSeek R1的API定價(jià)計(jì)算，理論上一天的總收入為56.2萬美元，成本利潤率為545%。

DeepSeek在知乎的文章中披露了其推算的成本、理論收入和利潤率圖片來源：知乎截圖

“這份成本利潤披露看似坦誠，實(shí)則暗藏殺機(jī)。它告訴所有人：大模型的游戲規(guī)則早已變了，單靠算法或者簡單囤積算力不能贏得大模型的勝利。在算法+數(shù)據(jù)+算力的三要素中，有效算力（算力x算力效率）才是最暴力美學(xué)的生存規(guī)則，唯快不破這個(gè)道理也適用于大模型行業(yè)。這份數(shù)據(jù)事實(shí)上是三頭六臂‘大鬧東海，腳踢很白的宮’的技術(shù)演繹，也是‘算力+智力’逆風(fēng)翻盤的真實(shí)寫照?！标愇”硎?。

值得注意的是，此前DeepSeek的重要信息發(fā)布一般在X、GitHub等以英文為主的平臺(tái)，而本次的發(fā)布還額外登錄了知乎，這瞬間引發(fā)了國內(nèi)AI圈的熱情，截至3月3日早，DeepSeek發(fā)布的文章在知乎獲得了7735個(gè)贊，以及866條評(píng)論。

尤洋遭網(wǎng)友“點(diǎn)名” DeepSeek API服務(wù)到底“虧不虧”？

新京報(bào)貝殼財(cái)經(jīng)記者注意到，不少網(wǎng)友本著“看熱鬧不嫌事大”的心態(tài)在這篇文章的評(píng)論區(qū)里“呼叫尤洋”，其中一條@尤洋知乎賬號(hào)的評(píng)論獲得了475個(gè)點(diǎn)贊，點(diǎn)贊數(shù)為評(píng)論區(qū)第二高。

這是因?yàn)?，此前尤洋曾發(fā)文直言“MaaS在中國短時(shí)間內(nèi)可能是最差的商業(yè)模式”“滿血版DeepSeek R1每日輸出1000億tokens，那么每個(gè)月虧損4億”，引發(fā)了業(yè)界對(duì)MaaS商業(yè)模式的爭論。

潞晨科技創(chuàng)始人尤洋微博截圖

AI與云基礎(chǔ)設(shè)施專家左鵬飛表示，DeepSeek和尤洋之間觀點(diǎn)沖突的主要原因是對(duì)每臺(tái)H800機(jī)器能跑出多大吞吐量的認(rèn)知不同。

“根據(jù)尤洋老師的采訪視頻，4臺(tái)機(jī)器跑出的吞吐量是1K tokens/s，而DeepSeek官方跑出的數(shù)據(jù)是平均每臺(tái)機(jī)器14.8K tokens/s, 有14.8*4 ≈ 59倍的性能差距。不同MaaS服務(wù)提供商對(duì)相同機(jī)器上相同模型跑出來的吞吐量可以相差59倍，那么自然有的MaaS服務(wù)商能掙錢，有的MaaS服務(wù)商大虧錢。這也證明AI Infra的系統(tǒng)優(yōu)化能力是多么重要?！弊簌i飛說。

對(duì)于網(wǎng)友的“點(diǎn)名”，尤洋本人也發(fā)文進(jìn)行了回應(yīng)，他認(rèn)為DeepSeek文章中的數(shù)據(jù)對(duì)計(jì)算MaaS成本沒有太多參考價(jià)值，因?yàn)槲恼掳袲eepSeek網(wǎng)頁，APP和MaaS API的token數(shù)加在一起計(jì)算，且數(shù)據(jù)是建立在大量用戶把DeepSeek的APP和網(wǎng)頁完全超負(fù)荷占滿的情況下，不是一個(gè)常規(guī)的MaaS。

貝殼財(cái)經(jīng)記者發(fā)現(xiàn)，DeepSeek提到的545%利潤率更多指的是“理想情況”，DeepSeek在官方文章里也表示“當(dāng)然我們實(shí)際上沒有這么多收入，因?yàn)閂3的定價(jià)更低，同時(shí)收費(fèi)服務(wù)只占了一部分，另外夜間還會(huì)有折扣?！?/p>

尤洋強(qiáng)調(diào)，自己對(duì)DeepSeek的模型能力沒有貶低，但其使用體驗(yàn)非常差，“我春節(jié)期間用過幾次，問一個(gè)問題，然后說繁忙，讓我稍后嘗試，我等了15分鐘或者一小時(shí)。這不是一個(gè)合格的MaaS產(chǎn)品。”

似乎為了證明自己的觀點(diǎn)，尤洋在發(fā)布完回應(yīng)文章后，宣布潞晨科技將在一周后停止提供DeepSeek的API服務(wù)，

潞晨科技公眾號(hào)截圖

對(duì)此，左鵬飛告訴新京報(bào)貝殼財(cái)經(jīng)記者，尤洋的觀點(diǎn)有一定的道理，但“即使考慮上資源預(yù)留，也就是545%的利潤率除以2或3，依然是盈利的，不影響我提到的核心邏輯?！?/p>

兩家MaaS供應(yīng)商開吵“嘴架” 引出抄襲“舊賬”

這一事情的發(fā)展開始逐漸“跑偏”。尤洋在回復(fù)網(wǎng)友后，又在知乎發(fā)文，矛頭直指春節(jié)期間最早開始承接DeepSeek流量，為用戶提供“滿血版DeepSeek服務(wù)”的硅基流動(dòng)，認(rèn)為該公司“犧牲員工春節(jié)假期捆綁華為宣傳、在小紅書拉人頭、API速度慢”等。

對(duì)此，袁進(jìn)輝在朋友圈反擊稱“我們團(tuán)隊(duì)愿意拼搏抓一個(gè)機(jī)會(huì)有什么錯(cuò)？邀請(qǐng)用戶送點(diǎn)免費(fèi)券有什么錯(cuò)？春節(jié)那幾天，全民都想訪問DeepSeek而不得時(shí)，我們提供了僅有的一個(gè)穩(wěn)定的服務(wù)?！蓖瑫r(shí)，他還提到了此前潞晨科技曾抄襲過硅基流動(dòng)。

這導(dǎo)致更多AI圈人士被牽涉進(jìn)來，如尤洋提到該起抄襲事件代碼的負(fù)責(zé)人是原潞晨科技CTO方佳瑞，但后者發(fā)長文回應(yīng)了自己的“背鍋”經(jīng)歷，表示代碼在自己入職之前就已存在。

此外，橘皮優(yōu)團(tuán)隊(duì)在2024年11月發(fā)布的對(duì)潞晨科技的公開信也被挖出，該公開信提到，“潞晨云算力云平臺(tái)公然抄襲我們的業(yè)務(wù)模式和機(jī)主協(xié)議，侵犯了知識(shí)產(chǎn)權(quán)。”袁進(jìn)輝轉(zhuǎn)發(fā)了該公開信并配文稱：“不是一次抄襲，多次發(fā)生。”

貝殼財(cái)經(jīng)記者注意到，雖然潞晨科技和硅基流動(dòng)彼此指責(zé)，但二者都曾和華為云合作，為用戶推出基于國產(chǎn)算力的DeepSeek服務(wù)，而在DeepSeek公布開源方案之后，這些AI Infra企業(yè)能否復(fù)現(xiàn)DeepSeek的技術(shù)細(xì)節(jié)，從中攤薄成本，就成了考驗(yàn)企業(yè)技術(shù)實(shí)力的時(shí)候。

值得注意的是，雖然DeepSeek在過去一周中開源了多個(gè)代碼庫，但大多數(shù)是針對(duì)英偉達(dá)芯片架構(gòu)的。對(duì)此，有開發(fā)者告訴貝殼財(cái)經(jīng)記者，這些開源成果無法直接用在華為云的推理服務(wù)中，但其思想可以借鑒。

當(dāng)前，DeepSeek的成本透明化如同一面鏡子，映照出了AI Infra企業(yè)的理想與現(xiàn)實(shí)，如何更好地借鑒DeepSeek的解決方案，控制企業(yè)成本，或許才是“破局”的鑰匙，畢竟545%的理想利潤率已經(jīng)被DeepSeek“點(diǎn)出”。

當(dāng)技術(shù)紅利逐漸消退，AI Infra企業(yè)需回答更本質(zhì)的問題：是繼續(xù)內(nèi)卷于算力租賃的價(jià)格戰(zhàn)，還是以模型優(yōu)化、場景深耕和生態(tài)整合構(gòu)建真正的壁壘？這場爭議或許只是序幕，行業(yè)的生存法則正在被重新書寫。

記者聯(lián)系郵箱：luoyidan@xjbnews.com

新京報(bào)貝殼財(cái)經(jīng)記者羅亦丹

編輯王進(jìn)雨

校對(duì) 柳寶慶

34 +1

微信

97视频在线观看播放,国产成人拍精品视频午夜网站,99久久国产综合精品麻豆,99久久er这里只有精品18 ,国产69精品久久久久久

DeepSeek公開利潤引服務(wù)商互懟 AI基建如何降本

我要評(píng)論

熱點(diǎn)

最新