亚洲成精品动漫久久精久,九九在线精品视频播放,黄色成人免费观看,三级成人影院,久碰久,四虎成人欧美精品在永久在线

掃一掃
關注微信公眾號

理論探討:聚焦線程級并行設計(二)
2009-01-11   

多內核架構的替代方案

所有用于商業服務器的主要處理器都已經采用了多內核(和多線程)技術,或者將很快采用這種技術。多內核芯片市場目前僅存的幾家公司是AMD(x86)、IBM(POWER處理器和大型計算機)、英特爾(x86和)和Sun(UltraSPARC處理器)。還有一些專業廠商。但是,要得到有關他們的設計的準確信息幾乎是不可能的。其它公司似乎只是對現有的處理器設計做一些逐步改進,而不是做嶄新的設計。

那么,除了上述四家公司之外,其它公司在通用服務器方面還有機會嗎?有替代目前的工業標準架構的多內核和多線程版本的其它設計方向嗎?我認為,簡短的答案是非常確定的“沒有”。即使主要OEM廠商和獨立軟件經銷商在支持英特爾安騰芯片方面明顯遇到了困難,其它廠商是否有機會也是值得懷疑的。

因此,雖然這里有很多有趣的“替代的”設計,但是我認為,它們并不值得在這里討論。多內核設計有許多可能的變化和發展方向。

臺式電腦處理器

由于AMD和英特爾在臺式電腦和便攜式電腦市場展開競爭,這兩家公司誰也不能降低單線程芯片的性能和價格。此外,大多數PC軟件廠商從多處理器(或者多內核)設計中沒有得到什么好處。出于同樣的原因,超線程總的來說也沒有給桌面應用程序帶來好處。例如,從TLP設計中受益的游戲程序很少。雖然Photoshop軟件和視頻編碼從中受益了,但是,這些應用程序更像是工作站的任務,而不是大眾市場的任務。芯片對于消費者或者企業桌面電腦而言都是一種硬性推銷。我對某些充滿信心的預測感到意外。這些預測稱,雙內核處理器將在幾年內成為這些市場的主流(盡管不會占統治地位)。

在不增加處理器主頻的前題下,增加第二個CPU內核來說將顯著增加生產成本和耗電量。而如果以更快的速度運行一個更大的芯片則更加困難。因此,雙內核芯片運行的時鐘速度將低于同等速度的單內核芯片。從根本上說,制作一個多內核芯片,你將損害單線程性能、同時承擔更高的價格和耗電量。雖然雙內核芯片具有完成工作站式的任務的優點,但是,雙內核處理器在臺式電腦領域還很難成為主流。盡管雙內核處理器對于一小部分需要強大計算功能的用戶和愛好者是非常有用的,但是,這似乎仍然難以證明雙內核處理器在臺式電腦中的應用是合理的。最低限度的額外成本肯定要使雙內核芯片無法進入低端市場。

對于軟件優化,我們遇到了一個傳統的先有雞還是先有蛋的問題:對于客戶端軟件來說,獨立軟件開發商沒有必要花費更大的精力讓軟件從基于多內核處理器(或多線程)的系統中受益,因為需要的用戶很少。同時又由于得不到多內核處理器的好處,用戶將很少購買多內核系統。最容易從多內核處理器系統中受益的是游戲市場,因為很多游戲將重新開發,使這些游戲從一開始就很容易增加多線程功能。游戲對于計算能力的需求是無止境的,因此,游戲非常適用于做成多線程的游戲。然而,現代的游戲引擎仍需要很長的開發時間。

SMT(同步多重執行功能)能夠稍微提高多線程的性能,并且可能在幾年之內成為主流。但是,這種技術對于臺式電腦和便攜式電腦用戶的益處很小。不過,從長遠來看,這將緩慢地鼓勵獨立軟件經銷商制作更多的多線程軟件,使雙內核芯片更加有用。

然而,對于處理器公司來說還有一個基本的問題:要銷售單個線程性能低于單內核的價格昂貴的多內核處理器是很困難的。我認為,正在為臺式電腦生產雙內核芯片的CPU廠商肯定是受到了生產服務器雙內核芯片的影響。這些公司將用更多的時間試驗這個市場。我預計,在未來的很多年里,廠商將積極地試驗這個市場。但是,在本十年內,雙內核桌面處理器還不會成為主流。

不過是一家值得關注的公司。索尼的PS3游戲機肯定需要先進的并行編程,以便最大限度地提高性能。但是,隨著高清晰度電視機的大量出貨、市場普及率的提高和高清晰度電視應用的日益增長,索尼很可能把PS3游戲機升級為一種消費者臺式電腦。他們將為最常用的應用程序量身訂做“足夠好”的消費者軟件,并且從另一個角度推動家庭娛樂市場的融合。這是一種與PC完全不同的銷售和市場營銷模式,較低的價格和簡單性對消費者是最有吸引力的。

從單內核走向雙內核設計需要做出的的多種選擇

一家處理器設計公司要根據當前的單內核處理器制作雙內核版本的處理器可以有多種選擇。讓我們考慮一下主要的考慮因素。

最重要的選擇之一是功率預算。如果一個單內核芯片在以2.5GHz的速度運行時耗電量為100瓦,由于耗電量主要來自于CPU內核,雙內核芯片的耗電量可能會提高一倍。一個200瓦的芯片要進行冷卻是很昂貴的。因此,這不能作為升級的選擇。也許把耗電量僅增加到120至130瓦還是一種選擇。當然,功率預算越小,采用的時鐘速度就會越低。

保持較低的功率預算的另一個理由是,目前配置2個處理器的1U服務器對于許多數據中心來說實際上都太熱了。增加功率預算就會提高用戶選擇時鐘速度較低的服務器或者刀片式服務器的機會。對于用戶來說,熱密度正在成為一個日益嚴重的問題。

不過,設計者可以調整雙內核處理器的設計,通過降低雙內核處理器的最大運行速度使雙內核處理器更省電。降低處理器的時鐘速度意味著將采用不太激進的和更省電的晶體管設計。換句話說,由于這些設計的改變,在時鐘速度和電壓相同的情況下,一個單內核CPU的內核耗電量可能會稍微高于雙內核芯片中的一個CPU內核的耗電量。

緩存采取什么設計也是非常重要的。一級緩存從來不允許不同的內核共享,因為那需要大量修改設計,不值得。但是,共享更高一級的緩存如何呢?對于服務器程序來說,共享4MB的二級緩存肯定比每個內核都配置2MB的二級緩存更有利,因為在大多數情況下,這兩個內核都會共享大量的有用的數據(和程序)。單線程程序也會從大容量緩存中受益。共享緩存的不利因素是可能輕微地影響最小延遲時間。此外,隨著兩個內核共享較小的緩存,緩存的共享部分很可能會出現沖突。對于共享問題的簡短答案是,你擁有的緩存越多,共享緩存就越好。

IBM的POWER4和POWER5處理器共享芯片上的二級緩存(1.5至2MB),多內核處理器能夠共享龐大的三級緩存。Sun的第一款UltraSPARC IV處理器的設計已經把外部的二級緩存分開了(每個內核8MB)。但是,第二代的這種處理器在芯片上有2MB的二級緩存以及一個在芯片之外共享的32MB三級緩存。Sun的“Gemini”處理器有兩個分開的0.5MB的二級緩存,每個內核一個緩存。

AMD計劃在2005年晚些時候推出的雙內核Opterons處理器中每個內核配置一個1MB的二級緩存。我認為,那是緩存的最大極限了,超過2MB的緩存就應該分開。對于英特爾雙內核的安騰處理器,二級緩存和三級緩存都是不可以共享的。雖然這看起來有些浪費,但是,為此進行額外的設計也許不值得。英特爾的雙內核Xeons處理器是個什么樣子目前還不清楚。也許這種處理器的任何緩存也都不能共享。

TLP如何影響服務器的競爭

到目前為止,IBM是惟一一家從雙內核處理器中受益最大的公司,因為IBM出貨雙內核處理器已經有很長時間了。幾年之內,市場上銷售的大多數服務器處理器都將是雙內核(或更多內核)和64位的處理器。從廠商的市場份額來看,這個影響并不大,因為如果每一家廠商都以同樣的速度改善產品,所以廠商的競爭地位就不會發生太大的變化。

另一方面,多內核處理器和多線程內核將以更快的速度提高實際性能。這將導致每個服務器配置的處理器的平均數量下降:很多客戶將購買雙/多內核的單處理器的服務器,而不是購買雙處理器的服務器;購買配置兩個雙/多內核處理器的服務器,而不是購買配置4個單內核處理器的服務器,以此類推。這將使整個高端服務器市場的價格降下來,更接近x86服務器領域。隨著AMD和英特爾的x86處理器采用64位技術,這對多內核處理器更有幫助。

對于安騰、POWER和SPARC處理器的設計者來說,開發成本將會減少。比較簡單的內核意味著設計工作量的減少,以及測試和生產更簡單。這種設計方式在被全新的設計方式取代之前可能會持續較長的時間。最后,多內核芯片在生產方面的不利因素很少,因為多內核芯片在臺式電腦領域用處不大,所以英特爾和AMD不會像以前那樣利用它們在臺式電腦芯片設計和產量上的優勢。

英特爾好像仍將對未來的安騰處理器采用通用的設計。但是,AMD和Sun似乎更愿意進行“僅用于服務器”的芯片設計。這并不意味著這些廠商將放棄工作站市場,或者追求最低限度的單線程功能,而是為了減少對設計更好的工作站、臺式電腦或者便攜式電腦的處理器的擔心。由于IBM和Sun對處理器和服務器的設計是同時進行的,這將包括它們系統設計的主要變化。英特爾未來將協調安騰和x86服務器系統的設計,使這兩種產品線的插座兼容。不過,英特爾新的首席執行官似乎并不急于改變他們工作的優先次序。

雖然多內核處理器向低端市場的擴張對于x86服務器是有幫助的,但是,這將使IBM和Sun更容易地生產出具有更高的性價比和競爭力的低端服務器,因為產量低,這些產品的設計成本非常高。對于Sun來說,制作Niagara處理器好像一直是沒有實際意義的,因為一個更簡單的CUP內核的開發成本更低,更容易投放市場。Sun似乎要專門為Niagara芯片增加更高的性能與耗電量的比例,以便獲得額外的優勢。在許多數據中心,1U服務器的耗電量正成為一個嚴重的問題。

(未完待續)


熱詞搜索:

上一篇:理論探討:聚焦線程級并行設計(一)
下一篇:服務器加速技術一覽(1)

分享到: 收藏