DDR驗證是任何SoC設計過程中最關鍵也是最復雜的任務之一,因為它牽涉到位于待測器件內的控制器和位于待測器件外的DDR存儲器。一個DDR系統由在一起工作的控制器、I/O、封裝、插座、電源、時鐘和外部存儲器組成。在數字驗證中,并不是所有這些元件都能驗證到,但主要是控制器、PHY、I/O和存儲器。由于在數字仿真中無法模擬所有元件的效應,驗證變得更加復雜,但門級仿真(GLS)給我們提供了一個很好的基礎架構,來報告主要從時序角度看可能影響控制器-PHY-I/O路徑的設計問題。 在門級仿真中驗證DDR時會遇到許多與時序有關的問題,從而導致驗證團隊與靜態時序分析(STA)團隊之間發生大量迭代工作。如果有徹底調試過的門級仿真環境,人們對運行于寄存器傳輸級(RTL)之上的DDR協議進行靜態時序分析將會充滿信心,并且會專注于解決數字和時序方面的問題。本文整理了DDR門級仿真驗證過程中由于RTL上的時序可見性而常常報告的各種問題,并通過一些例子強調了門級仿真環境中實現DDR快速有效收斂的重要調試標準。 借助多級IO處理慣性延時問題 RTL環境沒有任何時序意識,因此在設計中沒有慣性/傳播延時,但當我們轉移到門級仿真(GLS)設置時,就必須有效地考慮慣性/傳播延時了,以便模擬實際的硅片行為,同時不會使事情變得太過悲觀。在邏輯單元輸入端出現的持續時間小于慣性延時的脈沖,將不會導致該邏輯單元的輸出端發生任何的轉換,邏輯門表現出的這種現象被稱為慣性延時傳播。業界標準的門級仿真工具通常將傳播延時作為該邏輯門的慣性延時。仿真工具采用的這種建模方法是一種非常好的實際硅片行為提取的方法,事實上它確實很好地模擬了信號通過單級邏輯門的傳播。但這種行為在IO這樣的復雜門中并不是想要的,因為IO是多級結構,一旦信號通過第一級,就能保證它成功地通過IO單元傳輸。因為仿真工具不理解邏輯單元的這種內部結構,所以即使是多級IO最終它也會抑制這種脈沖,如圖1所示。 圖1:默認的門級仿真(GLS)行為是抑制小于門延時的所有轉換。 解決這個問題現在有兩種解決方案。 第一種解決方案是人工更新標準延時格式(SDF)文件,并將延時更新到一些較小的值。在信號傳播正常的情況這種方法非常管用,但當新的延時不能代表實際延時時,這種方法并不合適,并可能會抑制其它潛在的功能性問題。 工業標準的GLS仿真器確實有這樣的功能/開關,即允許/禁止特定寬度的脈沖通過單元。例如當使用“拒絕與誤差(Reject&Error)設置”時,將傳播寬度大于“誤差設置”值的所有信號。同時,這種仿真器在遇到寬度處于“拒絕與誤差設置”之間的信號時將傳播未知值,而且它會完全消除寬度小于“拒絕設置”的信號。下表1給出了一個例子。 表1: Pulse_e/Pulse_r行為 根據時序小組所做的平衡結果進行時鐘選擇 在RTL設置中,由特定源驅動的時鐘將同時到達所有節點,但在使用GLS設置時,就要考慮時鐘偏移了,它可能造成時序問題,即源自相同源的兩個時鐘路徑可能產生偏移,以至于DDR數據/時鐘路徑并不是對所有可能組合邏輯來說都是平衡的。在DDR設計中輸入時鐘是最重要的參數,因為所有其它信號都與輸入時鐘周期和占空比有關。也有這樣的情況,即可以將多個時鐘源用作控制器的輸入時鐘。一般來說,來自任何一個時鐘源的路徑只要是平衡的就可以推薦用作DDR輸入時鐘,不過對于傳播到外部DDR存儲器的DDR_CLK、DDR_DQS等信號來說,在占空比、高電平時間、低電平時間等方面有很嚴格的要求,必須滿足DDR正確工作所需的條件。在寫入側與占空比要求相關的大多數故障可能是DDR控制器輸入端時鐘的占空比不正確引起的。因此為了避免不必要的調試工作,必須確保我們使用了時序要求得到滿足的正確時鐘源。下面提到了同樣一個例子,其中捕獲到了存儲器輸入端的DQS占空比數據,而且有兩個不同的時鐘源被選為DDR控制器時鐘。 DDR_CLK 頻率:400MHz(約2.5ns) 55%×2.524ns = 1.388200ns 45%×2.524ns = 1.13580ns 表2:位于系統中不同層次的時鐘占空比數據。 焊盤上的負載用于轉儲SDF I/O在具有時序意識的門級仿真(GLS)DDR驗證中扮演著非常重要的角色。當滿足直到焊盤輸入端的時序要求時,就會從用于焊盤的許可文件提供的信息中轉儲出I/O延時數據。也有這樣的時候,即從控制器到焊盤輸入端的路徑得到了正確的平衡,但仍能見到故障發生。這可能是因為位于主控制器與外部DDR存儲器之間的路徑中的I/O引入了不正確的延時。這些延時實際上取決于施加到焊盤的負載。因此在產生SDF文件時,需要注意板子上必須應用了正確且實際的負載。做不到這一點可能在SDF文件中產生相當悲觀的時序片段,并當在GLS仿真中進行反標時可能產生偽故障。這種問題很難調試,相當耗時耗力。 表3:悲觀負載與實際負載比較。 輸出緩沖使能(OBE)時序要求 大多數DDR控制器的設計是這樣的,它們為了DQ(數據)和DQS(選通)焊盤本身而驅動OBE(輸出緩沖使能),因為相同的焊盤可以用于寫/讀。由于各種各樣的原因,OBE時序在服務路徑時一般會被忽略,但在DDR場合這樣做將導致災難性結果。舉例來說,在DDR協議讀/寫過程中,在READ/WRITE命令之后、在DQS第一個上升沿之前的DQS上的低電平(LOW)狀態被認為是讀/寫先導碼;同樣,最后一個數據入單元之后在DQS上的低電平狀態被認為是讀/寫后導碼。前導部分為接收器件提供了一個時序窗口,用于激活其數據捕獲電路,同時在選通信號上呈現一個已知/有效的電平,從而避免錯誤觸發捕獲電路。在前導部分過后的數據串發生期間選通信號將以與時鐘信號相同的頻率觸發。在寫入操作過程中是有特定的時序要求的,對DDR2來說必須滿足比如0.35Ck的最小前導寬度,DDR3是0.9Ck。同樣,對寫后導時序也有要求。DDR2是0.4Ck至0.6Ck,DDR3最小是0.3Ck。如果在DDR GLS時遇到這種最常見的問題,這些參數可能會發生違例。 圖2:DDR的前導和后導。 DDR焊盤的壓擺率設置 焊盤以不同的壓擺率進行表征,壓擺率決定了單位時間內輸出電壓的變化率。這些設置在RTL仿真中是沒有任何作用的,因為RTL仿真中不關心延時。但在GLS仿真中要考慮延時因素,因此為了避免不必要的調試工作,正確的設置非常重要。系統中針對不同焊盤的時序要求一般是要滿足最大壓擺率,但根據不同的參數有不同的要求。一個這樣的例子是,像DDR等協議如果知道了最大壓擺率,就能發現反射和干擾問題。這個參數在不同的設置情況下焊盤延時會有很大的變化,具體取決于最終在實際電路板和測試儀上使用的負載和電阻值。我們必須確保在設置了正確的焊盤參數下開展仿真,以便消除期望結果和觀察結果之間的偏差。 表4提供了針對某個SoC的不同接口的推薦SRE設置值。 表4:針對SoC不同接口的推薦壓擺率設置。 I/O中的表征問題 這方面的問題同樣只在門級仿真(GLS)中可見,在RTL中是不會遇到這種問題的。如果從一開始就得到保證,就可以確保能夠最大程度地減少驗證和靜態時序分析之間的反復調試和反饋。就背景而言,每個單元都有一個與上升沿和下降沿有關的延時。任何單元的延時都直接取自于擁有PVT間延時信息的許可文件。針對單元的這些上升和下降時間每個都不同。但DDR等協議對占空比、高電平時間、低電平時間等都有嚴格的要求,必要滿足這些要求才能確保協議正確工作。設計中常用上升和下降時間幾乎相同的對稱緩沖器和單元,確保CLK、DQS等關鍵信號路徑的平衡。但I/O的上升和下降時間也可能因為表征問題而存在很大差異,這種情況下將破壞占空比,進而在存儲器端導致違例。 圖3:上升下降延時差異導致占空比要求的違例。 SDF延時近似是高速門級仿真驗證的關鍵 測試平臺有一個時間刻度用于定義設計仿真時的事件顆粒度。在時間刻度語句中,第一個值是時間單位,第二個值是仿真的精度。對于高速電路來說定義時間刻度的精度必須非常謹慎。一般來說,測試平臺中的時間刻度定義為1ns/10ps,這意味著所有延時都將被近似為最接近的10ps。但在DDR等時序非常重要的高速協議中,裕量可能非常小(在ps數量級)。舉例來說,如果數據路徑中有10個緩沖器,每個的延時為26ps,那么如果時間刻度是1ns/10ps,所有這些延時都將被近似為30ps,進而在門級仿真中將引入40ps的不精確性。這將在門級仿真中導致錯誤的時序違例。有鑒于此,仿真環境必須更新到合適的時間刻度才能避免這樣的問題發生。 應該解決來自存儲器的錯誤 一般來說,仿真中可以使用不同供應商提供的模型。這些模型可以是Verilog模型或Denali模型。這些模型可能來自美光、Spansion、Macronix等存儲器供應商。針對仿真目的最好選用Denali模型,因為這些模型對所有時序參數和協議都做了非常嚴格的檢查,而且還包括CK/DQS/DQ之間的抖動和偏移,因此非常接近于電路板中使用的實際存儲器。當在存儲器接口處違反任何時序規格時,模型將標記上錯誤信息。RTL仿真中是沒有延時的,如果時序參數得到了正確配置,那么正常情況下不會遇到這些錯誤。但在GLS仿真中需要考慮延時因素,因此很可能發生某些參數違例,錯誤信息被拋出來。對這些錯誤必須仔細審查,并加以解決。正常情況下,當信號由控制器給出并到達存儲器時,在寫周期中會遇到這些問題。在讀周期中,信號是模型自身產生的并到達控制器。Denali存儲器模型有許多開關用于控制各種參數,如允許的差分偏移、將存儲器初始化到某個值、禁止來自存儲器的錯誤消息等。必須注意的是,沒有哪個開關可以忽略,這樣做很可能屏蔽重要的錯誤信息。 本文小結 從上述討論的各個要點看,很明顯門級仿真(GLS)有助于發現在RTL級無法預料的設計問題,并在做成硅片前得到解決。如果我們一味地從事重復勞動,那么在門級仿真中調試DDR可能是一個極具挑戰性的任務,但通過經驗并遵循基本的調試規則可以使工作順利開展。這些問題與門級仿真其它協議時常常遇到的問題不同,也更有技巧性,因此經常耗費更長的調試時間。從一開始就關注這些關鍵的調試參數可以在門級仿真中實現高效快速的DDR調試,并有助于在更早的SoC設計階段發現隱藏的設計問題。 |