国产毛片a精品毛-国产毛片黄片-国产毛片久久国产-国产毛片久久精品-青娱乐极品在线-青娱乐精品

充分發揮FPGA浮點IP內核的優勢

發布時間:2010-10-13 11:58    發布者:techshare
關鍵詞: FPGA , IP內核 , 浮點
對于通信、軍事、醫療等應用中的很多復雜系統,首先要使用浮點數據處理算法,利用 C或者 MATLAB軟件進行仿真和建模。而最終實現幾乎都采用定點或者整數算法。算法被仔細映射到有限動態范圍內,調整數據通路中的每一功能。這就需要很多取整和飽和步驟,如果處理的不合適,就會對算法性能有不利的影響。在集成過程中一般還需要進行大量的驗證工作,以確保系統工作符合仿真結果。

以前,由于缺乏 FPGA工具包的支持, FPGA設計人員一般不選擇浮點算法。使用很多浮點 FPGA運算符時,由于需要大量邏輯和布線資源,因此,它的另一個缺點是性能太差。 FPGA高效實現復數浮點函數的關鍵是使用基于乘法器的算法,利用大量集成在 FPGA器件中的硬件乘法器資源。用于實現這些非線性函數的乘法器必須有很高的精度,以保證乘法迭代過程中的精度要求。而且,高精度乘法器不需要在每一次乘法迭代中進行歸一化和逆歸一化處理,大大降低了對邏輯和布線的要求。  

FPGA采用硬件數字信號處理 (DSP)模塊,能夠實現高效的 36位x36位乘法器,對于單精度浮點算法,提供足夠的位數,滿足一般的單精度 24位尾數要求。這些乘法器還能夠用于構建更大的乘法器,實現高達 72位 x72位的雙精度浮點算法。

由于浮點算法動態范圍較大,相對于浮點仿真,大大簡化了系統性能驗證任務,因此,對于設計人員而言,這種算法通常能夠提高性能。在某些應用中,定點算法是不可行的。動態范圍要求使用浮點算法的一個常見的例子是矩陣求逆運算。

浮點 IP內核  

Altera現在提供業界最全面的單精度和雙精度浮點 IP內核,其性能非常高。目前提供的浮點 IP內核包括:  
  • 加法 /減法
  • 乘法
  • 除法
  • 倒數
  • 指數
  • 對數
  • 平方根
  • 逆平方根
  • 矩陣乘法
  • 矩陣求逆
  • 快速傅立葉變換 (FFT)
  • 對比
  • 整數和分數轉換

基本功能

圖1詳細列出了基本浮點功能及其性能。對比浮點除法與加減法所需要的資源及其性能,表明系統設計人員不需要在算法中避開除法運算以簡化硬件實現。



矩陣乘法  

Altera在提供基于 FPGA的參數賦值浮點矩陣IP內核方面有其獨到之處。這些運算符集成了數十甚至上百個浮點運算符,保持了較高的性能。矩陣乘法內核還可以用于完成標準測試或者 GFLOP/S和 GFLOP/W。  

SGEMM矩陣乘法內核的性能結果如表1所示,它實際是后編譯時序逼近結果,與確定 GFLOP/S通常使用的 Altera公司充分發揮 FPGA浮點 IP內核的優勢 紙筆浮點計算方法不同。任何其他 FPGA供應商都不支持這類基準測試,用戶使用 Altera Quartus. II軟件中提供的參數賦值矩陣乘法 IP內核,很容易自己進行測試。

表 1. 單精度矩陣乘法性能結果  



注釋:  

(1) 自適應邏輯模塊  

(2) 18x18 DSP模塊

使用 Quartus II功耗估算器,很容易計算得到實際的每瓦每秒 giga浮點結果 (GFLOPS/W)。使用 Altera. Stratix. IV EP4SE230 FPGA部分資源時,結果達到了 5 GFLOPS/W。使用 Stratix IV EP4SE530器件中更大的矩陣乘法內核,結果大約為 7 GFLOPS/W,計算密度為 200 GFLOPS。利用整個器件實現大規模浮點算法時,分散了 FPGA靜態功耗,效率非常高。  

Altera開發的浮點技術大大降低了實現大規模浮點數據通路的邏輯和布線資源要求。使用浮點數據通路優化工具非常關鍵,對資源要求的降低使得單位浮點邏輯/布線運算比達到了高端 FPGA的水平。這反映在工具能夠實現接近 300 MHz的 fMAX,與例化的矩陣乘法規模無關。通過這種方式,在大規模浮點設計中,用戶能夠可靠的使用 FPGA 80%以上的資源,實現大于 200-MHz的 fMAX性能。

矩陣求逆  

FPGA中浮點算法最常見的應用是矩陣求逆。大部分無線多輸入多輸出 (MIMO)算法、雷達 STAP系統、醫療成像聚束和很多高性能計算應用都需要進行矩陣求逆。參數賦值矩陣求逆浮點 IP內核的實例性能 (表2)顯示了非常高的矩陣吞吐量。 4x4矩陣求逆內核能夠進行每秒 2千萬次矩陣求逆運算,速度足以支持 LTE無線 MIMO應用。

表 2. 單精度浮點矩陣求逆 (Cholesky算法)性能



快速傅立葉變換  

FFT是另一種大動態范圍應用實例。由于 FFT算法的內在特性,位精度一般會隨著 FFT長度增加而增大。某些應用使用級聯 FFT,需要更大的動態范圍。很多雷達應用使用 FFT進行定點算法,裝入測距數據。這一般還需要第二次 FFT,裝入多普勒測距數據,動態范圍足夠高,需要采用浮點算法。如圖3和圖4所示,相對于定點算法,需要增加邏輯以實現單精度浮點算法,而電路 fMAX、存儲器和乘法器基本相似。



結論  

Altera新的浮點電路優化技術集成到浮點 IP內核中,同時提高了密度,并提供更多的邏輯資源,實現了優異的 FPGA浮點性能。其他供應商提供專用浮點處理器解決方案,但是,大部分都達不到 Altera FPGA解決方案的 GFLOPS高性能水平,而且沒有一個能夠實現 Stratix IV FPGA解決方案的 GFLOP/W性能。國家科學基金會 (NSF)高性能配置計算中心 (CHREC)的獨立基準測試證明了這一點,認為 Stratix IV EP4SE530雙精度浮點處理的性能最好。  

Altera FPGA的其他優點包括業界領先的外部存儲器帶寬資源以及性能達到 12.5 Gbps的SERDES收發器等。  

FPGA平臺還提供性能最好的定點數據通路,實現了非常靈活的 I/O和存儲器接口。通過這些功能, Stratix IV FPGA成為構建高性能浮點數據通路的理想平臺,可以用在多種應用中,從高性能計算到雷達和電子戰,直至基于 MIMO的 SDR/無線系統,以及無線聚束應用等。
本文地址:http://m.qingdxww.cn/thread-32067-1-1.html     【打印本頁】

本站部分文章為轉載或網友發布,目的在于傳遞和分享信息,并不代表本網贊同其觀點和對其真實性負責;文章版權歸原作者及原出處所有,如涉及作品內容、版權和其它問題,我們將根據著作權人的要求,第一時間更正或刪除。
您需要登錄后才可以發表評論 登錄 | 立即注冊

廠商推薦

  • Microchip視頻專區
  • Dev Tool Bits——使用MPLAB® Discover瀏覽資源
  • Dev Tool Bits——使用條件軟件斷點宏來節省時間和空間
  • Dev Tool Bits——使用DVRT協議查看項目中的數據
  • Dev Tool Bits——使用MPLAB® Data Visualizer進行功率監視
  • 貿澤電子(Mouser)專區

相關視頻

關于我們  -  服務條款  -  使用指南  -  站點地圖  -  友情鏈接  -  聯系我們
電子工程網 © 版權所有   京ICP備16069177號 | 京公網安備11010502021702
快速回復 返回頂部 返回列表
主站蜘蛛池模板: 日日夜夜免费精品视频 | 国产日本欧美在线观看乱码 | 国产欧美日韩精品高清二区综合区 | 黑人最猛性free护士hd | 欧美在线观看视频一区 | 色骚综合 | 中文字幕天堂久久精品 | 国产精品香蕉在线一区二区 | 成人欧美一区二区三区在线观看 | 99热国内精品 | 精品成人一区二区三区免费视频 | 国产精品久久现线拍久青草 | 成人精品国产亚洲欧洲 | 国产91网站在线观看免费 | 国产亚洲精品国产 | 好男人社区神马www在线观看 | 免费高清精品国偷自产在线 | 日韩最新网址 | 国产噜噜噜| 在线精品一区二区三区 | 秃顶老头xxxxxxxxx | 久久久久久久国产高清 | 色丁香久久 | 国产三级精品三级在线专区91 | 99re这里只有精品66 | 免费一级做a爰片久久毛片潮 | 国产精品一级香蕉一区 | 激情天堂 | 日本不卡视频在线 | 亚洲男人天堂网址 | 男人天堂b| 国产开嫩苞视频 | 国产日韩欧美91 | 自拍偷拍亚洲区 | 欧美www在线观看 | 国产精品国产三级国产a | 成人福利在线看 | 国产成人综合网在线观看 | 欧美在线播放一区二区 | 最近最新2019年中文字幕 | 中文国产日韩欧美视频 |