【中國市場告急】
4月16日凌晨,英偉達(dá)在向美國證券交易委員會(huì)(SEC)提交的8-k文件中表示,公司已經(jīng)接到美國特朗普政府通知,在沒有得到許可的情況下,未來將無限期暫停對中國出口H20芯片。
2022年,拜登對華實(shí)施半導(dǎo)體出口管制,英偉達(dá)為了不丟掉中國市場特地設(shè)計(jì)了符合出口管制的H20,其本質(zhì)就是英偉達(dá)旗艦芯片H100的“閹割版”。
雖然H20在計(jì)算能力、互聯(lián)速度和帶寬等層面比不上旗艦AI芯片H100和H800(H20算力不到H100的15%),但這已經(jīng)是英偉達(dá)為中國市場開發(fā)的3款GPU中功能最強(qiáng)大的一款,市場接受度頗高。
有數(shù)據(jù)顯示,2024年英偉達(dá)光H20就賣了120億-150億美元,帶動(dòng)英偉達(dá)中國區(qū)收入狂飆。根據(jù)最新披露的財(cái)報(bào),英偉達(dá)中國區(qū)2024自然年的營收高達(dá)171.08億美元,為歷史最高值,中國已成為英偉達(dá)在全球的第四大收入來源地。
進(jìn)入2025年,中國市場再次掀起狂潮,僅第一季度英偉達(dá)就向中國銷售了價(jià)值160億美元的H20。
禁售中國,無異于自毀基業(yè)、自斷前程。
全世界范圍內(nèi),中美兩國是最積極、也最舍得在算力上投資的國家,根據(jù)國際市場調(diào)研機(jī)構(gòu)Omdia的數(shù)據(jù),2024年英偉達(dá)Hopper系列芯片全球前五大買家分別是微軟(48.5萬枚)、字節(jié)跳動(dòng)(23萬枚)、騰訊(23萬枚)、Meta(22.4萬枚)、亞馬遜(19.6萬枚)。
而且從趨勢上來看,中國算力投資的前途與潛力還要遠(yuǎn)大于美國。
2024年四季度,騰訊、阿里的資本支出增速分別高達(dá)386%、258%,在全球主要科技公司中排名第一和第二。另據(jù)《財(cái)經(jīng)雜志》統(tǒng)計(jì),2025年字節(jié)跳動(dòng)、阿里、騰訊的資本支出總額預(yù)計(jì)將增長約69%,而亞馬遜、微軟、谷歌、Meta、Oracle今年的資本支出總額預(yù)計(jì)只增長大約29%。
如果按照正常的發(fā)展秩序,英偉達(dá)接下來每年依然可以從中國市場賺取源源不斷地巨額利潤,但特朗普的倒行逆施讓這一切全都成了泡影。
華爾街對此更是一片嘩然,英偉達(dá)股價(jià)當(dāng)天開盤直線跳水,一天就跌沒了1.3萬億人民幣,這對于今年市值已經(jīng)縮水三分之一的英偉達(dá)來說無疑是雪上加霜。
事實(shí)上,與中國脫鉤對英偉達(dá)造成的負(fù)面影響還遠(yuǎn)不止賬面這些損失。
大家都知道英偉達(dá)的顯卡厲害,其實(shí)英偉達(dá)AI帝國的真正根基是CUDA。
CUDA是英偉達(dá)在2006年推出的一個(gè)并行計(jì)算平臺(tái)和編程模型,它讓開發(fā)者能夠直接在GPU上編寫代碼,從而大幅提升計(jì)算速度。CUDA上的開發(fā)者越多,功能就越強(qiáng)大,這又會(huì)吸引更多軟件去主動(dòng)適配CUDA,由此形成一個(gè)良性循環(huán)。
經(jīng)過近20年的迭代和積累,CUDA已經(jīng)煉出了獨(dú)一無二的能力。英偉達(dá)通過CUDA這個(gè)軟件生態(tài)鎖定硬件市場,用CUDA就要買英偉達(dá)的顯卡,就像當(dāng)年用iOS系統(tǒng)就要買蘋果手機(jī)是一個(gè)道理。目前CUDA生態(tài)已經(jīng)積累大約430萬開發(fā)者,其中來自中國的開發(fā)者有150萬,占比高達(dá)30%以上,可以說是一個(gè)非常重要的基本盤。
不出意外的情況下,CUDA只會(huì)越來越強(qiáng)大,畢竟大家已經(jīng)熟悉了這個(gè)生態(tài),而且英偉達(dá)的實(shí)力也很難被替代。而如果強(qiáng)行脫鉤,那就只能另當(dāng)別論,因?yàn)楹桶l(fā)展相比,安全永遠(yuǎn)都是最重要的。
一旦失去中國開發(fā)者,對英偉達(dá)來說也是一筆不小的損失。
更讓黃仁勛頭疼的是,他的中國對手已經(jīng)在準(zhǔn)備躍躍欲試、取而代之了。
【從追趕到超越】
盡管國產(chǎn)芯片與英偉達(dá)芯片在單卡性能方面還存在一定差距,但在全球GPU整體稀缺的背景下,單卡性能已相對沒那么重要,通過多卡集群互聯(lián)可迅速縮小算力差距,甚至實(shí)現(xiàn)反超。
4月10日,華為正式發(fā)布CloudMatrix 384超節(jié)點(diǎn)。
所謂超節(jié)點(diǎn)就是將傳統(tǒng)單節(jié)點(diǎn)(如8卡昇騰服務(wù)器)通過新型高速總線緊耦合互聯(lián),形成一個(gè)單一邏輯計(jì)算單元。這種架構(gòu)可以突破物理服務(wù)器的邊界,實(shí)現(xiàn)資源池化與對等互聯(lián),使算力規(guī)模暴增。CloudMatrix 384基于384顆昇騰芯片構(gòu)建,是迄今為止中國目前最大的商用超節(jié)點(diǎn),規(guī)模、算力、性能均已全面超越英偉達(dá)NVL72。
數(shù)據(jù)顯示,CloudMatrix 384實(shí)現(xiàn)的算力規(guī)??蛇_(dá)300PFlops,相比NVL72的180 PFlops提升了67%。
根據(jù)英國《金融時(shí)報(bào)》此前的報(bào)道,華為最新AI芯片昇騰910C的良品率已提高至40%,相比一年前的20%翻了整整一倍。2025年,華為計(jì)劃量產(chǎn)10萬塊910C和30萬塊910B芯片,而在2024年這一數(shù)據(jù)分別為0和20萬塊。
在軟件生態(tài)層面,華為升騰的異構(gòu)計(jì)算架構(gòu)CANN對標(biāo)英偉達(dá)CUDA + CuDNN核心軟件層。2024年,整個(gè)生態(tài)體系再次升級(jí),成功發(fā)布CANN 8.0和MindSpore2.4版本,截至去年年底,鯤鵬、昇騰的開發(fā)者數(shù)量已超665萬。
當(dāng)產(chǎn)能、技術(shù)、生態(tài)齊步拉升,華為平替英偉達(dá)就只是時(shí)間問題了。
事實(shí)上,當(dāng)年華為被制裁前本就是領(lǐng)先英偉達(dá)的。
2019年,昇騰910剛問世時(shí)的半精度(FP16)算力就已達(dá)到256TFLOPS,是當(dāng)時(shí)算力最強(qiáng)的AI處理器,比同期英偉達(dá)旗艦產(chǎn)品Tesla V100 GPU的125 TFLOPS高一倍。如果不是美國政府強(qiáng)行干預(yù),今天站在世界算力舞臺(tái)中央的究竟是誰恐怕都要打一個(gè)問號(hào)。
最了解你實(shí)力的永遠(yuǎn)是你的對手。
英偉達(dá)自2024年開始連續(xù)兩年將華為列為競爭對手,黃仁勛更是在接受國外媒體采訪時(shí)盛贊華為是中國最強(qiáng)大的科技公司。
黃仁勛很清楚,一旦英偉達(dá)撤出中國市場,華為將迅速填補(bǔ)這個(gè)空白。
也正因如此,他才會(huì)突訪北京,并在17日的會(huì)談中明確表示希望與中國繼續(xù)合作。
說到底,中國已經(jīng)可以沒有英偉達(dá),但英偉達(dá)現(xiàn)在還不能沒有中國。