上傳時(shí)間:2012年2月6日 關(guān)鍵詞:處理器、系統(tǒng)架構(gòu)、AMD
  AMD公司副總裁暨終端部門技術(shù)長(zhǎng) Joe Marci 稍早前表示,簡(jiǎn)化平行運(yùn)算的編程,同時(shí)讓軟件工程師能盡情發(fā)展他們的想象力,是這家公司下一個(gè)要追求的圣杯?! ≡谏栽缜暗?DesignCON 大會(huì)上,Marci表示,AMD的工程師目前正在努力的目標(biāo),是讓今天的CPU程序設(shè)計(jì)師們都能運(yùn)用異質(zhì)系統(tǒng)架構(gòu)(heterogeneous sySTems architecture, HSA)開發(fā)該公司的加速處理單元(APU)。  Marci表示, HSA 結(jié)合了 CPU 上的純量處理和 GPU 上的平行處理能力,同時(shí)能在更低功耗下提供更高的存儲(chǔ)器存取頻寬。他同時(shí)指出,硬件編程必須更加簡(jiǎn)單,而且還必須更容易達(dá)到最佳化和負(fù)載平衡,但這一切都極具挑戰(zhàn)性。盡管這些任務(wù)看起來困難重重,但Macri表示,硬件開發(fā)人員們并不需要重頭開始,因?yàn)閼{借著該公司超過40年的處理器開發(fā)經(jīng)驗(yàn),工程人員可以開發(fā)出一種極具擴(kuò)展力的系統(tǒng)?! acri也指出,不斷地思考并完善硬件設(shè)計(jì),也將使軟件開發(fā)人員能更自由地運(yùn)用硬件來進(jìn)行開發(fā)?!败浖こ處熅拖笫乾F(xiàn)代的米開朗基羅,”他表示,AMD對(duì)HSA架構(gòu)的期許,就是要讓軟件開發(fā)人員能更專注地進(jìn)行開發(fā),實(shí)現(xiàn)他們的愿景?!叭绻谲浖_發(fā)過程中還必須考慮到硬件,將會(huì)抑制這些工程師的創(chuàng)造力或想象力,”他說?! ‘?dāng)然,所謂的‘愿景’也不斷在產(chǎn)生變化,如最近一段時(shí)間以來,人們與計(jì)算機(jī)的互動(dòng)方式產(chǎn)生了很大改變,如迅速崛起的手勢(shì)觸控等。  “你需要能在低功耗下執(zhí)行的功能,而且還要為消費(fèi)者提供良好的使用經(jīng)驗(yàn),”Macri說。而這將需要極大的并行處理能力。

  AMD將CPU和GPU融合在單一芯片而成的APU僅僅是個(gè)開端,Macri說,而未來的APU則將再納入HSA,他同時(shí)希望能盡快HSA成為業(yè)界標(biāo)準(zhǔn)?!皹?biāo)準(zhǔn)有助于建構(gòu)完整的生態(tài)系統(tǒng),讓所有廠商在公平的環(huán)境中競(jìng)爭(zhēng),”他解釋道,AMD正在推動(dòng)真正開放和實(shí)際上的標(biāo)準(zhǔn),讓整個(gè)產(chǎn)業(yè)都可以使用?!皶r(shí)間會(huì)證明,開放標(biāo)準(zhǔn)終將獲得勝利,”Macri說,因?yàn)檐浖_發(fā)人員也希望他們的應(yīng)用程序能在多個(gè)硬件廠商提供的平臺(tái)上執(zhí)行?! acri認(rèn)為,所謂的“架構(gòu)時(shí)代”(architected era)將包含完整的C++,并使用GPU作為協(xié)處理器。它還涉及統(tǒng)一的一致性地址空間、任務(wù)平行運(yùn)行、巢狀資料平行編程、使用者模式調(diào)度、搶占(pre-emption)和環(huán)境切換等?!  敖裉?,我們開發(fā)的每一種設(shè)備,都受到一定的功率限制,因此,動(dòng)態(tài)功率平衡是至關(guān)重要的,”他表示。同樣地,在GPU中使用可尋址存儲(chǔ)器也代表著向前跨出了一大步,Macri說。盡管一致性并不能確保元件執(zhí)行得更快,但卻能讓軟件開發(fā)人員更加專注于他們的領(lǐng)域。并非取代OpenCL  Macri進(jìn)一步指出,HSA也不會(huì)取代OpenCL,相反地,HSA將會(huì)是為OpenCL最佳化的一種平臺(tái)架構(gòu)。“如果你想寫OpenCL,這將會(huì)是一種能讓OpenCL執(zhí)行得更好的硬件?!薄 ∈聦?shí)上,在HSA上使用OpenCL將能避免不必要的拷貝,并具備低延遲調(diào)度、改善記憶模型,以及能在CPU和GPU之間分享指針等優(yōu)勢(shì),他說。此外,HSA也為那些希望能在最后階段進(jìn)行控制并調(diào)整性能的開發(fā)者提供較低層的編程界面,同時(shí),經(jīng)過最佳化的庫(kù)也可以選擇這些較低層的界面?! 〗裉斓拿詈驼{(diào)度流程步驟都太多了,Macri認(rèn)為這很浪費(fèi),因?yàn)橛昧诉@么多開銷,卻僅能執(zhí)行部份功能。  他指出,在采用HSA之后,應(yīng)用程序便能直接進(jìn)入硬件隊(duì)列,不需要多余的驅(qū)動(dòng)器?!皼]有API來處理這些,也沒有核心模式驅(qū)動(dòng)器,更沒有軟件隊(duì)列,只要直接存取硬件就好了,”他解釋道。


  但重點(diǎn)是要切換運(yùn)算,而不是搬移資料。今天,所有的處理器都同時(shí)執(zhí)行串列和平行核心,每個(gè)核心都應(yīng)該能以不同的性能水平運(yùn)作,而且也應(yīng)該很容易編程。其架構(gòu)必須能支援以編程模式為基礎(chǔ)的大規(guī)模資料集和任務(wù),但同時(shí)維持開放性。

  “未來的芯片架構(gòu)路徑非常明確,”Marci說。“這條道路將從建構(gòu)在對(duì)稱多處理器(SMP)系統(tǒng)上的可編程模式朝異構(gòu)領(lǐng)域轉(zhuǎn)移。這種架構(gòu)將會(huì)是開放的,它將擁有公開規(guī)格和開放原始碼軟件堆棧,異質(zhì)核心將能運(yùn)用一致性存儲(chǔ)器良好地相互運(yùn)作,且延遲極低,也不會(huì)有軟件相沖問題。  不過,Macri也表示,這個(gè)愿景恐怕不會(huì)很快來到。