1. 面積與速度的平衡與互換 這里的面積指一個設計消耗FPGA/CPLD的邏輯資源的數量,對于FPGA可以用消耗的FF(觸發器)和LUT(查找表)來衡量,更一般的衡量方式可以用設計所占的等價邏輯門數。 面積和速度這兩個指標貫穿FPGA/CPLD設計的時鐘,是設計質量的評價的終極標準 —— 面積和速度是一對對立統一的矛盾體。 要求一個同時具備設計面積最小、運行頻率最高是不現實的。更科學的設計目標應該是在滿足設計時序要求(包括對設計頻率的要求)的前提下,占用最小的芯片面積;蛘咴谒幎ǖ拿娣e下,是設計的時序余量更大、頻率跑的更高。這兩種目標充分體現了面積和速度的平衡的思想。 作為矛盾的兩個組成部分,面積和速度的地位是不一樣的。相比之下,滿足時序、工作頻率的要求更重要一些,當兩者沖突時,采用速度優先的準則。 從理論上講,如果一個設計時序余量較大,所能跑的速度遠遠高于設計要求,那么就通過功能模塊的復用來減少整個設計消耗的芯片面積,這就是用速度的優勢換取面積的節約。反之,如果一個設計的時序要求很高,普通方法達不到設計頻率,那么一般可以通過將數據流串并轉換,并行復制多個操作模塊,對整個設計采取乒乓操作和串并轉換的思想運行! 2. 硬件原則 硬件原則主要針對HDL代碼編寫而言:Verilog是采用了C語言形式的硬件的抽象,它的本質作用在于描述硬件,它的最終實現結果是芯片內部的實際電路。所以評判一段HDL代碼的優劣的最終標準是:其描述并實現的硬件電路的性能,包括面積和速度兩個方面。 評價一個設計的代碼水平較高,僅僅是說這個設計是由硬件想HDL代碼這種表現形式的轉換更加流暢、合理。而一個設計最終性能,在更大程度上取決于設計工程師所構想的硬件實現方案的效率以及合理性。(HDL代碼僅僅是硬件設計的表達形式之一) 初學者片面追求代碼的整潔、簡短,是錯誤的,是與HDL的標準背道而馳的。正確的編碼方法,首先要做到對所需實現的硬件電路胸有成竹,對該部分的硬件的結構和連接十分清晰,然后再用適當的HDL語句表達出來即可。 另外,Verilog作為一種HDL語言,是分層次的。系統級--算法級--寄存器傳輸級--邏輯級--門級--開關級。構建優先級樹會消耗大量的組合邏輯,所以如果能夠使用case的地方,盡量使用case代替if.....else...... 3. 系統原則 系統原則包含兩個層次的含義:更高層面上看,是一個硬件系統,一塊單板如何進行模塊花費和任務分配,什么樣的算法和功能適合放在FPGA里面實現,什么樣的算法和功能適合放在DSP/CPU里面實現,以及FPGA的規模估算數據接口設計等。具體到FPGA設計就要對設計的全局有個宏觀上的合理安排,比如時鐘域、模塊復用、約束、面積、速度等問題,在系統上模塊的優化最為重要。 一般來說實時性要求高,頻率快的功能模塊適合FPGA實現。而FPGA和CPLD相比,更適合實現規模較大、頻率較高、寄存器較多的設計。使用FPGA/CPLD設計時,應該對芯片內部的各種底層硬件資源,和可用的設計資源有一個較深刻的認識。 比如FPGA一般觸發器資源豐富,CPLD的組合邏輯資源更加豐富。FPGA/CPLD一般是由底層可編程硬件單元、BRAM、布線資源、可配置IO單元、時鐘資源等構成。 底層可編程硬件單元一般由觸發器和查找表組成。Xilinx的底層可編程硬件資源較SLICE,由兩個FF和2個LUT構成。Altera的底層硬件資源叫LE,由1個FF和1個LUT構成。使用片內RAN可以實現單口RAM、雙口RAM、同步/異步FIFO、ROM、CAM等常用單元模塊。 一般的FPGA系統規劃的簡化流程 4. 同步設計原則 異步電路的邏輯核心是用組合邏輯電路實現,比如異步的FIFO/RAM讀寫信號,地址譯碼等電路。電路的主要信號、輸出信號等并不依賴于任何一個時鐘性信號,不是由時鐘信號驅動FF產生的。異步時序電路的最大缺點是容易產生毛刺,在布局布線后仿真和用邏輯分析儀觀測實際信號時,這種毛刺尤其明顯。 同步時序電路的核心邏輯用各種各樣的觸發器實現,電路的主要信號、輸出信號都是由某個時鐘沿驅動觸發器產生出來的。同步時序電路可以很好的避免毛刺,布局布線后仿真,和用邏輯分析儀采樣實際工作信號都沒有毛刺。 是否時序電路一定比異步電路使用更多的資源呢?從單純的ASCI設計來看,大約需要7個門來實現一個D觸發器,而一個門即可實現一個2輸入與非門,所以一般來說,同步時序電路比異步電路占用更大的面積。(FPGA/CPLD中不同,主要是因為單元塊的計算方式) 如何實現同步時序電路的延時?異步電路產生延時的一般方法是插入一個Buffer、兩級與非門等,這種延時調整手段是不適用同步時序設計思想的。首先要明確一點HDL語法中的延時控制語法,是行為級的代碼描述,常用于仿真測試激勵,但是在電路綜合是會被忽略,并不能啟動延時作用。 5. 乒乓操作 “ 乒乓操作 ” 是一個常常應用于數據流控制的處理技巧,乒乓操作的處理流程為:輸入數據流通過 “ 輸入數據選擇單元 ” 將數據流等時分配到兩個數據緩沖區,數據緩沖模塊可以為任何存儲模塊,比較常用的存儲單元為雙口 RAM(DPRAM) 、單口 RAM(SPRAM) 、 FIFO 等。 在第一個緩沖周期,將輸入的數據流緩存到 “ 數據緩沖模塊 1” ;在第 2 個緩沖周期,通過 “ 輸入數據選擇單元 ” 的切換,將輸入的數據流緩存到 “ 數據緩沖模塊 2” ,同時將 “ 數據緩沖模塊 1” 緩存的第 1 個周期數據通過 “ 輸入數據選擇單元 ” 的選擇,送到 “ 數據流運算處理模塊 ” 進行運算處理;在第 3 個緩沖周期通過 “ 輸入數據選擇單元 ” 的再次切換,將輸入的數據流緩存到 “ 數據緩沖模塊 1” ,同時將 “ 數據緩沖模塊 2” 緩存的第 2 個周期的數據通過 “ 輸入數據選擇單元 ” 切換,送到 “ 數據流運算處理模塊 ” 進行運算處理。如此循環。 6. 串并轉換設計技巧 串并轉換是 FPGA 設計的一個重要技巧,它是數據流處理的常用手段,也是面積與速度互換思想的直接體現。串并轉換的實現方法多種多樣,根據數據的排序和數量的要求,可以選用寄存器、 RAM 等實現。 前面在乒乓操作的圖例中,就是通過 DPRAM 實現了數據流的串并轉換,而且由于使用了 DPRAM ,數據的緩沖區可以開得很大,對于數量比較小的設計可以采用寄存器完成串并轉換。如無特殊需求,應該用同步時序設計完成串并之間的轉換。比如數據從串行到并行,數據排列順序是高位在前,可以用下面的編碼實現:prl_temp<={prl_temp,srl_in}。 其中, prl_temp 是并行輸出緩存寄存器, srl_in 是串行數據輸入。對于排列順序有規定的串并轉換,可以用 case 語句判斷實現。對于復雜的串并轉換,還可以用狀態機實現。串并轉換的方法比較簡單,在此不必贅述。 7. 流水線操作設計思想 首先需要聲明的是,這里所講述的流水線是指一種處理流程和順序操作的設計思想,并非 FPGA 、 ASIC 設計中優化時序所用的 “Pipelining” 。 流水線處理是高速設計中的一個常用設計手段。如果某個設計的處理流程分為若干步驟,而且整個數據處理是 “ 單流向 ” 的,即沒有反饋或者迭代運算,前一個步驟的輸出是下一個步驟的輸入,則可以考慮采用流水線設計方法來提高系統的工作頻率。 流水線設計的結構 流水線設計的結構示意圖如圖所示。其基本結構為:將適當劃分的 n 個操作步驟單流向串聯起來。流水線操作的最大特點和要求是,數據流在各個步驟的處理從時間上看是連續的,如果將每個操作步驟簡化假設為通過一個 D 觸發器 ( 就是用寄存器打一個節拍 ) ,那么流水線操作就類似一個移位寄存器組,數據流依次流經 D 觸發器,完成每個步驟的操作。 8. 數據接口的同步方法 數據接口的同步是 FPGA/CPLD 設計的一個常見問題,也是一個重點和難點,很多設計不穩定都是源于數據接口的同步有問題。在電路圖設計階段,一些工程師手工加入 BUFT 或者非門調整數據延遲,從而保證本級模塊的時鐘對上級模塊數據的建立、保持時間要求。 還有一些工程師為了有穩定的采樣,生成了很多相差 90 度的時鐘信號,時而用正沿打一下數據,時而用負沿打一下數據,用以調整數據的采樣位置。這兩種做法都十分不可取,因為一旦芯片更新換代或者移植到其它芯片 組的芯片上,采樣實現必須重新設計。而且,這兩種做法造成電路實現的余量不夠,一旦外界條件變換 ( 比如溫度升高 ) ,采樣時序就有可能完全紊亂,造成電路癱瘓。 設計數據接口同步是否需要添加約束?建議最好添加適當的約束,特別是對于高速設計,一定要對周期、建立、保持時間等添加相應的約束。這里附加約束的作用有兩點:提高設計的工作頻率,滿足接口數據同步要求;獲得正確的時序分析報告。
be0d5e490bc2731ee4667b39ad923f0.png
東莞校區地址:東莞松山湖大道與石大路交匯松湖智谷A5棟10樓
|