六月二十日,中國(guó)超算首次超過美國(guó)的消息不脛而走,給這個(gè)驕陽當(dāng)頭的六月更添了一把火,舉國(guó)上下為之振奮。許多媒體也推波助瀾,從標(biāo)題到內(nèi)容充滿了民族自豪感,特別是“神威·太湖之光”超級(jí)計(jì)算機(jī)第一次使用的中國(guó)自主知識(shí)產(chǎn)權(quán)的處理器芯片,讓這次中國(guó)超算超美有了更深層次上的意義。中國(guó)超算整機(jī)排名世界第一,國(guó)產(chǎn)處理器芯片功不可沒。雖然國(guó)產(chǎn)處理器芯片與世界先進(jìn)水平相比還有不小的差距,我們終于也可以揚(yáng)眉吐氣一把了!
一、是美國(guó)禁運(yùn)倒逼的結(jié)果?
很多人在看到這條消息時(shí),都引用了毛主席當(dāng)年說過的一段話:“封鎖吧!封鎖個(gè)十年、八年,中國(guó)的一切事情都解決了!”
這次中國(guó)超算首超美國(guó),其中一個(gè)大背景就是美國(guó)政府對(duì)中國(guó)高科技產(chǎn)品和技術(shù)的“禁運(yùn)”。在2008年的全球超級(jí)計(jì)算機(jī)500強(qiáng)榜單里,中國(guó)在前100名里沒有一席之地。隨著中國(guó)人的發(fā)力,世界超算的格局在迅速改變。2010年6月的排名,中國(guó)的星云超級(jí)機(jī)排名世界第二;一年后,中國(guó)又推出了天河1A超級(jí)機(jī),超過了原處第一位的美國(guó)美洲虎。2013年,中國(guó)推出了“天河2”,并在此后的三年里保持“六連冠”,穩(wěn)坐第一把交椅。
中國(guó)的超級(jí)機(jī)在“天河2”之前,一直是采用英特爾處理器。星云排名世界第二,使用了兩萬多個(gè)英特爾的六核至強(qiáng)(EXON)X5650芯片。“天河1A”也是使用了英特爾的至強(qiáng)服務(wù)器芯片和NVIDIA的顯示芯片。蟬聯(lián)六個(gè)第一的“天河2”采用的是英特爾的至強(qiáng)2692服務(wù)器芯片和PHI31S1P協(xié)處理器芯片。
就在“天河2”計(jì)劃將性能從33.86PF提升到110PF繼續(xù)保持世界領(lǐng)先時(shí),美國(guó)商務(wù)部以可能涉及核武計(jì)算為由,禁止英特爾向中國(guó)提供可供升級(jí)的PHI協(xié)處理器芯片,同時(shí)也禁止NVIDIA與AMD向中國(guó)出口顯卡芯片(GPGPU)??墒墙Y(jié)果卻事與愿違,一年后中國(guó)的超級(jí)機(jī)不僅保持了第一,而且總量還超過了美國(guó)。最令人震驚的是中國(guó)的超級(jí)機(jī)完全使用了中國(guó)自己生產(chǎn)研發(fā)的國(guó)產(chǎn)處理器芯片。
二、“買不到的”中國(guó)就可以造出來
有人說要感謝美國(guó)政府的禁運(yùn),禁運(yùn)倒逼了中國(guó)研發(fā)自主CPU的進(jìn)度,只要是買不到的中國(guó)就可以造出來。這個(gè)邏輯果真是這樣嗎?我們憑什么實(shí)力可以研發(fā)出自己的處理器芯片?
超算的核心技術(shù)除了處理器芯片(CPU),還有微體系結(jié)構(gòu)、存儲(chǔ)系統(tǒng)、指令系統(tǒng)、應(yīng)用軟件,以及功耗和可靠性等指標(biāo)。CPU雖是其中一環(huán),但卻是最具象征意義的一環(huán)。
“太湖之光”是第一臺(tái)全部采用國(guó)產(chǎn)CPU構(gòu)建的世界第一的超級(jí)計(jì)算機(jī)。從披露的資料看,這臺(tái)超算機(jī)使用的處理器芯片是一款通用數(shù)字信號(hào)處理器(GPDSP),因?yàn)閿?shù)字信號(hào)處理器有比較高的雙精浮點(diǎn)性能,完全可以替代英特爾的至強(qiáng)PHI芯片。美國(guó)的芯片禁運(yùn)反而縮短了中國(guó)的研制周期,使我們搞出了完全自主的高性能處理器和完全自主可控的超級(jí)計(jì)算機(jī),西方的芯片禁運(yùn)對(duì)中國(guó)可謂利大于弊。
太湖機(jī)體系結(jié)構(gòu)是自主設(shè)計(jì)的異構(gòu)設(shè)計(jì)。這個(gè)源于CELL結(jié)構(gòu)的設(shè)計(jì),就是我們熟悉的GPU通用計(jì)算(GPGPU)結(jié)構(gòu)。“太湖之光”采用了CPU和GPU的異構(gòu)組成。GPU的優(yōu)勢(shì)在于核心數(shù)非常多,一般可以過百上千,與民用CPU不超過8核16線程的數(shù)量相比非常懸殊,因此在一些計(jì)算場(chǎng)合下效率要比CPU高很多,而這些場(chǎng)合正是通用計(jì)算的優(yōu)勢(shì)。簡(jiǎn)單說就是CPU處理復(fù)雜任務(wù),GPU處理簡(jiǎn)單但量大的“暴力”計(jì)算。
太湖機(jī)采用的申威26010芯片在眾核處理器體系結(jié)構(gòu)方面有重大原始創(chuàng)新,采用了片上融合的異構(gòu)眾核架構(gòu),可支持多CPU工作。該芯片有260核。整個(gè)系統(tǒng)具有1000多萬個(gè)核。
三、國(guó)產(chǎn)處理器芯片研發(fā)的艱難之路
這次超算超美讓申威處理器芯片“一夜成名”。相比另一款知名度較高的“龍芯”,申威顯然低調(diào)了許多。龍芯的產(chǎn)業(yè)化是國(guó)家“核高基”重點(diǎn)支持項(xiàng)目,作為與載人航天、探月工程并列的16個(gè)重大科技專項(xiàng)之一,可見國(guó)家對(duì)國(guó)產(chǎn)處理器芯片的重視程度絕非一般。
申威的技術(shù)源于DECAlpha21164,這是一款在90年代盛極一時(shí)的高性能服務(wù)器/工作站處理器,采用精簡(jiǎn)指令集(RISC)架構(gòu)。申威處理器歷經(jīng)了三代產(chǎn)品。第一代申威2006年問世,采用單核設(shè)計(jì)、130nm制程工藝及900MHz工作頻率。第二代申威2008年發(fā)表,采用雙核設(shè)計(jì)、130nm制程工藝及1.4GHz工作頻率。第三代申威1600,內(nèi)建16個(gè)RISC64位核,65nm制程工藝及975-1200MHz工作頻率。
作為國(guó)內(nèi)知名度最高的龍芯CPU,其命運(yùn)多舛遠(yuǎn)不及申威。龍芯第一代、第二代產(chǎn)品只能用在嵌入式方案和入門級(jí)筆記本計(jì)算機(jī)市場(chǎng)。第三代突破了多核心設(shè)計(jì)(支持4-8核),開始進(jìn)軍服務(wù)器市場(chǎng)。龍芯的新一代產(chǎn)品采用40納米制程,主頻1GHz,是當(dāng)今英特爾、AMD的1/3。如果采用28納米制程,可大幅提升工作頻率,龍芯還有很長(zhǎng)的路要走。
龍芯自2010年起基本依賴市場(chǎng)化運(yùn)作自負(fù)盈虧。而申威專注超算市場(chǎng)不存在龍芯在PC市場(chǎng)遇到的軟件生態(tài)貧乏、產(chǎn)業(yè)聯(lián)盟弱小導(dǎo)致產(chǎn)品缺乏競(jìng)爭(zhēng)力的困境。龍芯的出路在軍方和航天市場(chǎng),它的抗輻射版本已進(jìn)入到北斗衛(wèi)星領(lǐng)域。在商場(chǎng)上龍芯還不具備和英特爾、AMD競(jìng)爭(zhēng)的能力,畢竟差距太大,新一代龍芯的絕對(duì)性能只是英特爾第四代CPU的20%~30%。
四、國(guó)產(chǎn)CPU與世界先進(jìn)水平的差距在哪里?
中國(guó)并不缺乏高性能CPU研制計(jì)劃,中國(guó)在先進(jìn)CPU研發(fā)已有20多年,特別是2011年中國(guó)啟動(dòng)“核高基“項(xiàng)目以后,CPU研發(fā)取得飛快進(jìn)步。反觀十多年前中國(guó)并沒有生產(chǎn)任何高性能CPU的能力。
目前能夠代表國(guó)產(chǎn)CPU發(fā)展水平的有“申威”、“龍芯”,以及在移動(dòng)通信領(lǐng)域表現(xiàn)搶眼的的華為(海思)手機(jī)處理器。華為(海思)智能手機(jī)處理器(K3V2),構(gòu)架采用ARM授權(quán)的Cortex-A9架構(gòu),40納米制程,是業(yè)界體積最小的4核CPU,內(nèi)建有16核GPU。三種CPU共同點(diǎn)是均避開Intel和AMD的x86構(gòu)架。其次是在發(fā)展自己的CPU技術(shù)時(shí),有效化借用了先進(jìn)的總線、主機(jī)芯片組技術(shù)。
國(guó)產(chǎn)CPU和英特爾的差距不僅僅是主頻上的差距,還有微結(jié)構(gòu)上的差距。微結(jié)構(gòu)的差距可以使CPU的性能相差占比在40%左右,CPU的安全性、性能、功耗主要取決于微結(jié)構(gòu)。國(guó)產(chǎn)CPU陣營(yíng)里宏芯、兆芯、展訊、海思都沒有自主微結(jié)構(gòu)設(shè)計(jì)。只有龍芯、飛騰有自己的微結(jié)構(gòu)設(shè)計(jì),但與英特爾相比仍有不小的差距。
五、現(xiàn)階段國(guó)產(chǎn)處理器面臨的主要問題
(1)缺乏軟件支持:在處理器研發(fā)時(shí),要有配套的應(yīng)用軟件一起使用。如果缺少操作系統(tǒng)對(duì)處理器的支持,那么其開發(fā)難度將會(huì)加大,所以對(duì)軟件的支持對(duì)國(guó)產(chǎn)處理器的研制意義十分巨大。
(2)性能較弱:國(guó)產(chǎn)處理器無論是在生產(chǎn)上,還是在應(yīng)用測(cè)試上都存在很大挑戰(zhàn),其總體水平與國(guó)際水平還有一定的差距。例如主頻,國(guó)產(chǎn)CPU的水平是1.6~2GHz,而國(guó)際上的主流處理器已經(jīng)超過了4GHz。性能較弱,國(guó)家對(duì)于軟件的重視程度不夠,這也是國(guó)產(chǎn)處理器未能快速發(fā)展的原因之一。
六、結(jié)語
國(guó)產(chǎn)CPU最新的研究成果是上海高性能集成電路設(shè)計(jì)中心設(shè)計(jì)的國(guó)產(chǎn)眾核芯片。該芯片采用28納米制程,峰值雙精度浮點(diǎn)運(yùn)算技術(shù)超過每秒3萬億次(3TFlops)。這個(gè)指標(biāo)完全追平了英特爾第二代至強(qiáng)PHI芯片。第二代至強(qiáng)PHI采用14納米制程,雙精度浮點(diǎn)運(yùn)算性能超過3TFlops。希望這一國(guó)產(chǎn)CPU新秀能早日實(shí)現(xiàn)產(chǎn)業(yè)化。
我國(guó)的CPU研發(fā)正處在一個(gè)新的階段。“太湖之光”超算超美是一個(gè)標(biāo)志性的事件,預(yù)示著國(guó)產(chǎn)處理器在研發(fā)和產(chǎn)業(yè)化方面發(fā)力正當(dāng)時(shí)。但縱觀處理器的全球市場(chǎng),國(guó)產(chǎn)CPU芯片還有很長(zhǎng)的一段路要走。處理器的研發(fā)不是一個(gè)人或是短時(shí)間內(nèi)就可以發(fā)展起來的,而是需要大量的人力以及財(cái)力,在國(guó)家層面推動(dòng)對(duì)處理器研發(fā)的重視。處理器體現(xiàn)的是一個(gè)國(guó)家科技水平強(qiáng)弱,大到關(guān)系著整個(gè)國(guó)家的信息安全,發(fā)展自主研發(fā)的處理器不僅是體現(xiàn)國(guó)家科學(xué)進(jìn)步的最佳方式,也是反映一個(gè)國(guó)家IT行業(yè)進(jìn)步的指標(biāo)性產(chǎn)業(yè)。因此國(guó)產(chǎn)處理器研發(fā)之路仍然任重而道遠(yuǎn)。
更多資訊請(qǐng)關(guān)注電力電子頻道