AMD公司副總裁暨終端部門CTO Joe Marci稍早前表示,簡化并行運算的編程,同時讓軟件工程師能盡情發展他們的想像力,是這家公司下一個要追求的圣杯。 在稍早前的DesignCon大會上,Marci表示,AMD的工程師目前正在努力的目標,是讓今天的CPU程序設計師們都能運用異質系統架構(heterogeneous systems architecture, HSA)開發該公司的加速處理單元(APU)。 Marci表示, HSA結合了CPU上的純量處理和GPU上的并行處理能力,同時能在更低功耗下提供更高的存儲器讀取頻寬。他同時指出,硬件編程必須更加簡單,而且還必須更容易達到最佳化和負載平衡,但這一切都極具挑戰性。 盡管這些任務看起來困難重重,但Macri表示,硬件開發人員們并不需要重頭開始,因為憑借著該公司超過40年的處理器開發經驗,工程人員可以開發出一種極具擴展力的系統。 Macri也指出,不斷地思考并完善硬件設計,也將使軟件開發人員能更自由地運用硬件來進行開發!败浖こ處熅拖袷乾F代的米開朗基羅,”他表示,AMD對HSA架構的期許,就是要讓軟件開發人員能更專注地進行開發,實現他們的愿景。 “如果在軟件開發過程中還必須考慮到硬件,將會抑制這些工程師的創造力或想像力,”他說。 當然,所謂的“愿景”也不斷在產生變化,如最近一段時間以來,人們與電腦的互動方式產生了很大改變,如迅速崛起的手勢觸控等。 “你需要能在低功耗下執行的功能,而且還要為消費者提供良好的用戶體驗,”Macri說。而這將需要極大的并行處理能力。 AMD將CPU和GPU融合在單一芯片而成的APU僅僅是個開端,Macri說,而未來的APU則將再納入HSA,他同時希望能盡快HSA成為業界標準。 “標準有助于建構完整的生態系統,讓所有廠商在公平的環境中競爭,”他解釋道,AMD正在推動真正開放和實際上的標準,讓整個產業都可以使用。 “時間會證明,開放標準終將獲得勝利,”Macri說,因為軟件開發人員也希望他們的應用程序能在多個硬件廠商提供的平臺上執行。 Macri認為,所謂的“架構時代”(architected era)將包含完整的C++,并使用GPU作為協處理器。它還涉及統一的一致性地址空間、任務并行運行、巢狀數據并行編程、使用者模式調度、搶占(pre-emption)和環境切換等。 “今天,我們開發的每一種設備,都受到一定的功率限制,因此,動態功率平衡是至關重要的,”他表示。 同樣地,在GPU中使用可尋址存儲器也代表著向前跨出了一大步,Macri說。盡管一致性并不能確保元件執行得更快,但卻能讓軟件開發人員更加專注于他們的領域。 并非取代OpenCL Macri進一步指出,HSA也不會取代OpenCL,相反地,HSA將會是為OpenCL最佳化的一種平臺架構!叭绻阆雽慜penCL,這將會是一種能讓OpenCL執行得更好的硬件! 事實上,在HSA上使用OpenCL將能避免不必要的拷貝,并具備低延遲調度、改善記憶模型,以及能在CPU和GPU之間分享指針等優勢,他說。 此外,HSA也為那些希望能在最后階段進行控制并調整性能的開發者提供較低層的編程介面,同時,經過最佳化的庫也可以選擇這些較低層的介面。 今天的命令和調度流程步驟都太多了,Macri認為這很浪費,因為用了這么多開銷,卻僅能執行部份功能。 他指出,在采用HSA之后,應用程序便能直接進入硬件佇列,不需要多余的驅動器!皼]有API來處理這些,也沒有核心模式驅動器,更沒有軟件佇列,只要直接存取硬件就好了,”他解釋道。 但重點是要切換運算,而不是搬移數據。今天,所有的處理器都同時執行串行和并行內核,每個內核都應該能以不同的性能水平運作,而且也應該很容易編程。其架構必須能支持以編程模式為基礎的大規模數據集和任務,但同時維持開放性。 “未來的芯片架構路徑非常明確,”Marci說!斑@條道路將從建構在對稱多處理器(SMP)系統上的可編程模式朝異構領域轉移。這種架構將會是開放的,它將擁有公開規格和開放源代碼軟件堆疊,異質核心將能運用一致性存儲器良好地相互運作,且延遲極低,也不會有軟件相沖問題。 不過,Macri也表示,這個愿景恐怕不會很快來到。 |