發(fā)展越迅速,越容易產(chǎn)生隱藏的弊病,這是我們都知道的道理。而這個(gè)道理同樣適用于概括NVIDIA在高性能計(jì)算方面的發(fā)展現(xiàn)狀。
首先,軟件的編程仍然是一個(gè)不可回避的問題。雖然NVIDIA在教育上投入了很多資源,但一款軟件要想適應(yīng)動(dòng)輒數(shù)百個(gè)CUDA核心 (NVIDIA GPGPU中的計(jì)算核心)仍然需要大規(guī)模的中心編譯和軟件架構(gòu)更新。在某些情況下,這個(gè)工程所帶來的工作量甚至比重寫軟件更多、更大。而這也是目前多線程軟件編程所普遍面臨的問題,而且核心和線程越多,問題就越復(fù)雜。另外,由于很多軟件之前是在X86架構(gòu)CPU上運(yùn)行的,而現(xiàn)在去需要這些軟件去盡量調(diào)用GPGPU的計(jì)算資源,而且要盡量的提高效率和做到并行化,因此,問題并不僅僅是調(diào)用幾個(gè)API這么簡單。
GPGPU作為脫胎于消費(fèi)領(lǐng)域的產(chǎn)品,其在設(shè)計(jì)上很難擺脫固有的局限性。由于NVIDIA以及競爭對(duì)手的GPU產(chǎn)品都來自于同樣核心的消費(fèi)級(jí)產(chǎn)品,所以產(chǎn)品在設(shè)計(jì)上為大規(guī)模并聯(lián)以及高性能計(jì)算所作的優(yōu)化十分有限,尤其是在消費(fèi)級(jí)市場仍是公司的最主要盈利手段的情況下。因此,以NVIDIA為代表的GPGPU在大規(guī)模部署時(shí)的效率問題始終是阻礙其發(fā)展的一大瓶頸。
根據(jù)NVIDIA前段時(shí)間公布的2011財(cái)年第三季度財(cái)報(bào)顯示,公司第三季度營收為10.662億美元,利潤為1.783億美元,毛利率52.2%(美國通用會(huì)計(jì)準(zhǔn)則)。在這之中,消費(fèi)級(jí)GPU銷售收入和嵌入式處理器的收入占據(jù)絕大部分;而其凈利潤110%的增長也大多由此而來。所以,對(duì)于NVIDIA來說,繼續(xù)保持自身在消費(fèi)級(jí)產(chǎn)品市場上的優(yōu)勢并大力發(fā)展嵌入式處理器業(yè)務(wù)才是最積極最穩(wěn)妥的發(fā)展策略。雖然高性能計(jì)算以及企業(yè)級(jí)應(yīng)用能夠?yàn)槠髽I(yè)帶來更高的毛利率,但從目前的情況下,高性能計(jì)算和相關(guān)的企業(yè)級(jí)市場規(guī)模并不很大,投入適當(dāng)?shù)馁Y源并保持宣傳力度,將該領(lǐng)域劃入潛在的可發(fā)展市場無疑是一個(gè)理性的選擇。以目前的情況,NVIDIA的實(shí)際動(dòng)作與這一策略不謀而合。
而GPGPU作為一款脫胎于消費(fèi)級(jí)市場的產(chǎn)品,其更新速度也必然非???。根據(jù)多年來的產(chǎn)品發(fā)布管理,NVIDIA會(huì)在每年第一或第二季度發(fā)布全新的旗艦級(jí)產(chǎn)品,并進(jìn)行全面的推廣。而新的旗艦級(jí)產(chǎn)品也必然會(huì)衍生出新一代的企業(yè)級(jí)、高性能計(jì)算產(chǎn)品以及相對(duì)應(yīng)的CUDA軟件編譯器。雖然每年更新?lián)Q代對(duì)于消費(fèi)級(jí)市場來說是可以接受的,但對(duì)于企業(yè)和高性能計(jì)算領(lǐng)域來說,這個(gè)速度顯然太快了。在高性能計(jì)算領(lǐng)域來中,半年甚至一年實(shí)施和調(diào)試周期是非常常見的。太快的產(chǎn)品更新速率使得高性能計(jì)算企業(yè)很難得到太多來自于NVIDIA的直接幫助,因?yàn)楫?dāng)企業(yè)需要幫助的時(shí)候,他們使用的產(chǎn)品往往已經(jīng)“過時(shí)”了。
另一方面,競爭同樣是NVIDIA在高性能計(jì)算領(lǐng)域所不得不面對(duì)的問題。眾所周知,由于英特爾和AMD等廠商的“圍追堵截”,NVIDIA在主板芯片組方面的業(yè)務(wù)全面萎縮,這大大影響了NVIDIA的發(fā)展,而NVIDIA將進(jìn)軍CPU行業(yè)的傳聞也最終沒有了下文。所以最后,NVIDIA不得不另尋出路,并有了今天的GPGPU和嵌入式處理器等產(chǎn)品線。但英特爾最為NVIDIA的另類對(duì)手,總是會(huì)在NVIDIA的前進(jìn)道路上出現(xiàn)。移動(dòng)顯示領(lǐng)域如此、嵌入式 CPU領(lǐng)域如此,現(xiàn)在英特爾也將憑借自身的眾核技術(shù)進(jìn)入高性能計(jì)算領(lǐng)域,與NVIDIA正面競爭。而英特爾廣泛的合作聯(lián)盟、充足技術(shù)儲(chǔ)備以及10倍于自身的市值都是NVIDIA不得不面對(duì)的困難。
而且,英特爾的眾核技術(shù)相對(duì)于NVIDIA的GPGPU技術(shù)也有自身的優(yōu)勢。前文我們已經(jīng)提到,不同硬件架構(gòu)之上的軟件編程是NVIDIA目前面對(duì)的一大難題;而英特爾的眾核技術(shù)的優(yōu)勢則在于則可以有效的避免這一問題。根據(jù)英特爾官方的宣傳,軟件編程人員可以在無需改變編程工具的情況下,通過采用并行度較高的指令、數(shù)據(jù)、任務(wù)、適量、線程等就可以實(shí)現(xiàn)在英特爾眾核硬件環(huán)境中的軟件編程工作。這就大大降低了高性能計(jì)算軟件的開發(fā)難度和成本,而這正是高性能計(jì)算用戶所樂于見到的。因?yàn)橄鄬?duì)于性能來說,資金和技術(shù)往往更會(huì)限制超算項(xiàng)目的實(shí)施和發(fā)展。
目前,NVIDIA在高性能計(jì)算領(lǐng)域內(nèi)的境地可以用一個(gè)微妙的十字路口來形容。一方面,高性能計(jì)算目前并不是NVIDIA的主營業(yè)務(wù)和利潤來源,相對(duì)于眼前的市場來說,高性能計(jì)算頂多只能算是NVIDIA的副業(yè);這一點(diǎn)沒人可以否認(rèn)。另一方面,潛在的激烈競爭也是NVIDIA大舉進(jìn)入這一市場所必需要考慮的一大問題。因?yàn)樵谫Y金、技術(shù)和聯(lián)盟如此強(qiáng)大的英特爾面前,以小博大的成功幾率可想而知。但無論如何,NVIDIA的GPGPU還是為高性能計(jì)算領(lǐng)域的發(fā)展帶來了一股技術(shù)的新風(fēng),為超算提升性能、降低能耗提供了一種新的路徑。而至于這一技術(shù)將如何發(fā)展,則是多方面因素所決定的。對(duì)此,我們應(yīng)該密切關(guān)注。