在市場需求的驅動下,為了提高速度、減少功耗、降低成本,半導體工藝遵循著摩爾定律,已經跨入深亞微米DSM時代。從180nm、130nm、90nm、65nm,再細到45nm。32nm、22nm似乎就在不遠的將來。若再往下縮減,晶體管的尺寸就接近單個原子,而原子無法縮減。為了追求尺寸更小、密度更高的器件而繼續微縮的代價將非常高昂,已經意義不大了。而在另一方面,隨著半導體工藝的升級細化,ASIC設計的路也越走越艱難,越走越窄。Gartner研究中心多年來的市場跟蹤研究結果表明,ASIC設計項目數量的總體趨勢已經無疑被認為是向下的。最新技術的ASIC設計費用已經上升到一個很高點,以致許多中小規模的公司用不起而只能采用FPGA。不過,正在研發的各種降低ASIC設計費用的新方法有助于將ASIC的優點回歸業界。 以eASIC為代表的結構化ASIC廠家率先找到了一種做得起ASIC的途徑。eASIC獨特的過孔層布線定制專利技術使用戶能夠在短時間內開發出高性能、低成本的ASIC和SoC。本文綜述深亞微米ASIC設計趨勢衰退的若干主要原因,分析兩種替代ASIC的器件FPGA和結構化ASIC的長短處,介紹eASIC公司的新一代 45nm結構化ASIC中的技術。闡明了深亞微米時代eASIC結構化ASIC的路越走越寬。 深亞微米ASIC設計趨勢走向衰退 設計一款芯片通常需要考慮以下因素:一是產品的性能,包括速度、芯片大小、功耗和可靠性;二是產品成本因素,選擇什么工藝、采用什么技術來實現,包括生產制造成本、NRE費用和研發成本;第三是市場因素,上市時間,從概念到實現的整個周期時間。在半導體工藝不斷升級帶來了規模的擴大、速度的提升、芯片價格下降的同時,卻遇到一系列難以逾越的障礙:設計流程復雜、生產良率降低、設計周期太長,研發制造費用劇增等等。阻止了摩爾規律的延續。 高昂的NRE費用、封裝測試費用令人望而生畏。90nm芯片的開模費至少是80萬美元,65nm芯片的開模費高達200萬美元,而45nm芯片的開模費則達到800萬美元以上。工藝細化帶來的一個挑戰是芯片設計技術日益復雜,對EDA設計工具的要求也越來越高。面對幾百萬上千萬的門級規模、幾百兆上千兆赫茲時鐘頻率的高密度設計,設計工程師必須考慮更多的不確定因素,自然更容易產生更多的設計反復,導致設計周期越來越長。 在傳統的ASIC流程中,設計師通常只負責描述IC的邏輯功能,定義各種物理實現的約束條件:如時序、I/O連接、功能分割、時鐘以及信號完整性和功率完整性。晶圓廠負責開發一個實現以下部分的平臺:單元庫、I/O單元、嵌入式存儲單元、硅片制造、封裝、封裝元件的測試,并將這些經過測試的元件提交給設計工程師。然而,進入DSM之后,硅片的特征結構遠遠要小于光刻工藝的激光波長,常規的設計規則已經不能適應生產工藝的要求。以往,設計師要面對的設計問題通常是STA時序收斂、IP驗證、IP適用性、DFT可測試設計。如今,設計工程師在設計驗證時經常發現,串擾、開關功耗以及定時收斂等問題更加難以捉摸。信號的完整性、工藝可變性非常棘手。即使滿足了設計規則,設計出來的產品往往無法確保能生產出來。造成生產良率上不去的根本原因就在于設計的東西往往無法制造。因此,設計工程師需要在設計的時候考慮對于可制造性的支持。 而要做到這點,需要與晶圓廠的密切配合,了解制造工藝、制造規則以及參考參數。這就是所謂的可制造性設計DFM(Design For Manufacturing)。DFM包括參數良率、系統良率、隨機良率、可靠性、測試和診斷的六大設計。這些設計都與晶圓廠的缺陷度、設計測試的有效性有著密切的關系,因而要求設計工程師、工藝工程師、設備工程師與掩模制造工程師通力合作,方能共同完成DFM任務。DFM要求整個半導體產業鏈的高度合作。而到目前為止,設計界和制造界一直被視作相互獨立的兩個不同的實體。大多數設計工程師仍然被隔離在制造工藝的復雜性之外,僅使用由代工廠提供的“設計規則”和“推薦使用的規則”來完成設計的DRC。 所有這些工具成本、人工成本、時間成本、制造成本的猛增也就意味著設計的風險猛增。粗略估計,工藝每升一級,芯片的開發成本至少要翻番,甚至更多。在現階段,設計一款45nm的芯片要耗資上億美元。據報道,目前只有AMD、Altera、IBM、Intel、Freescale、Samsung、Sony、NEC、Matsushita、Renesas、Qualcomm、Toshiba、TI、eASIC等十幾家廠商發布了40/45 nm產品,未來采用32nm甚至22nm的廠商只會越來越少。 FPGA難以抑制泄漏功耗 在ASIC的替代品中,可編程邏輯器件FPGA堪稱平民與貴族。說它是平民,是因為不需要掩模,不產生NRE費用,入門門檻低,FPGA深受廣大設計者的歡迎。由于具有高度的靈活性,相對簡單的EDA工具和設計流程,用戶可以方便將FPGA器件編程為自己所需要功能的芯片。因此,FPGA占據了很多ASIC的領域,特別是在諸如通信、儀器、工業、軍工、航天等許多具有中小批量、多品種特點的市場,取得了驕人的業績。說它是貴族,是因為FPGA用硅片面積來換取靈活性的,天生不足表現為資源利用率低、價格昂貴。FPGA中80%的硅片面積被用作布線路由,要多繞許多路徑,要過許多用晶體管搭建的開關。將基于SRAM的查找表LUT邏輯單元組成邏輯電路所需要的邏輯層數比ASIC多。因此,速度遠遠落后ASIC。即使到了65nm,FPGA在性能上也只能相當于180nm的ASIC,而成本上與180nm的ASIC芯片并沒有優勢。 盡管如此,FPGA在技術上近20年來發展迅速,向密度更高、速度更快發展,向低成本、低價格的片上系統方向發展,試圖拉近與ASIC的距離。Xilinx 已經發布了65nm Virtex-5和Spartan 3。 Altera也發布了65nm Stratix III, 最近又發布了40-nm Stratix IV。為了適應多方面應用的需求,FPGA也在不斷改良架構,包括減少邏輯層次,改進構造塊之間的信號互連等。還嵌入了處理器、乘法器、收發器等一些標準單元的硬IP Core。 不過,FPGA碰到了一個難以克服的頑疾--堵不住的泄漏電流、壓不低的靜態功耗。半導體工藝不斷細化的一個顯著好處是芯片的動態功耗不斷下降。因為可以采用更低的工作電壓,此外更小的尺寸有助于減小芯片內部分布電容。但在另一方面,由于晶體管體積的縮小,包括門極(柵極)泄漏電流以及源-漏泄漏電流在內的靜態泄漏卻在逐漸增加,因此帶來的功耗成了一大頑疾。門極泄漏就是電子穿過阻止其運動的絕緣層產生的泄漏電流。而在晶體管處于關斷狀態時,仍會有少量電子從源極向漏極流動,這就是源-漏泄漏。早在2004年,Intel發現因靜態泄漏導致的功耗已占到芯片總功耗的25%。進入65nm之后,隨著管子體積的縮小,標準薄氧化層晶體管的靜態泄漏急劇增大。為了同時實現高密度和低漏電流,業界各方面都在不懈努力研究各種減少泄漏電流的方法。一種稱為三重門極氧化層(triple-oxide)技術的工藝通過有選擇地增加門極氧化層厚度來減少泄漏電流,同時又不犧牲性能。盡管這三重門極氧化層仍很薄,但這些晶體管的確展現出比標準薄氧化層晶體管更低的漏電流。Intel公司則推出了針對45nm技術的HK+MG晶體管。所謂HK(High-K)就是采用相對二氧化硅而言具有很高絕緣常數的材料,它可在晶體管的門極和通道間產生一個強大的場效應,并呈現出很高的電子絕緣特性。采用金屬門MG (Metal Gate)還能增強門的場效應。因此,HK+MG組合有助于顯著減少漏電流,增加門電容和驅動電流。 雖然技術上設法減少了泄漏電流,但是由于FPGA的基本邏輯單元顆粒是基于SRAM的查找表LUT,還需要用大量的開關晶體管。有同樣功能的FPGA芯片的晶體管數量遠遠多于ASIC芯片,因而功耗會遠遠大于ASIC芯片,這樣必定增加了系統的熱負荷。 還需要指出的一點是,在設計流程方面人們往往認為ASIC的后端設計有著非常長的時間和復雜度,也容易出問題。事實上,進入DSM階段之后FPGA的后端的復雜度也并非想象的那么容易。如果同樣的設計在ASIC的后端實現中很困難,那么在FPGA中情況有可能更加惡化。因為同樣功能的邏輯電路映射在FPGA中的邏輯層數會比映射在ASIC中的邏輯層數增加很多,導致時序收斂更加困難。 為了克服FPGA的功耗大、價格高的缺點,FPGA廠商也都推出了自己的結構化ASIC技術,比如Altera的HardCopy。HardCopy是通過重新映射,把原來的FPGA邏輯用結構化的ASIC方式實現。這種方案能夠比FPGA明顯地降低芯片的尺寸。但是帶來的后果是時序有變化。這種方案由于需要掩模,從而也有NRE的問題。此外,HardCopy只能針對少數幾種型號的FPGA,不適用其全系列器件。 eASIC 實現ASIC價值重歸 為了減少標準單元ASIC設計的高昂的前期投入,簡化設計流程,規避市場風險,結構化ASIC應運而生。它們試圖在標準單元ASIC和FPGA之外中找到另外一條定做芯片的途徑。結構化ASIC是半成品,要做成客戶定制的芯片仍然需要掩模,只不過掩模層數少一些。總的來說,結構化ASIC能夠節省一半的NRE費用和設計時間,芯片的性能和功耗接近標準單元ASIC。但芯片價格的約是標準單元的1.5 "2倍,因為其密度大約只有標準單元ASIC的50%"75%左右。結構化ASIC的市場定位決定了其在ASIC與FPGA的夾縫中求生。或許是因為半導體工藝升級換代太快了的緣故,大多數結構化ASIC的優勢還沒有來得及完全發揮出來,就被新工藝淘汰出局。直到在90nm之前,大多數結構化ASIC在商業運作上都沒有FPGA成功。客戶要么更喜歡便宜的標準單元ASIC,要么更喜歡沒有風險的隨時都可重新編程的器件FPGA。除非把做ASIC的NRE降到微不足道,還要讓設計工程師避開復雜的后端設計的困擾,否則難以扭轉結構化ASIC尷尬的局面。eASIC公司率先做到了這一點。 eASIC在2006年推出90nm的結構化ASIC產品Nextreme。與其他結構化ASIC不同之處在于,只要用單一過孔層就可實現各種設計電路的定制。對所有的設計而言,從硅片到每層金屬層都是通用的,唯一不同的是一層過孔Via6。?由于這一過孔層可直接用激光束打造,實現無掩模定制樣片,處理時間快了10倍。因而無需NRE費用,樣片時間縮短到4周。量產時也只要一層過孔掩模,所發生的費用很容易被消化。金屬布線標準化和過孔可編程定制是eASIC在結構化ASIC上的獨門突破性技術。在短短1年半時間內,eASIC 就完成了120多個項目設計。令人驚訝的是,在90nm Nextreme ASIC產品快速成功的基礎上,eASIC跳過了65nm直接奔向45nm,2008年8月4日發布了其45nm產品Nextreme-2,站在了業界的前列。 在45nm結構化ASIC產品Nextreme-2系列中,eASIC基本保持了第二代產品中的全金屬布線,單一過孔編程定制的體系,只是將這一定制過孔層從第6層調整到了第4層。但在架構上、基本邏輯單元eCell的顆粒結構上和周邊的資源配置上做了重大改進。 eASIC改良了查找表(LUT)的結構以進一步提供速度、降低功耗。摒棄了原有基于SRAM的查找表LUT結構,改用可編程過孔Via接地或者接Vcc來替代SRAM的輸出。此外,還省去了LUT第一級的開關晶體管,如圖所示。因此省掉了大量的晶體管。大大降低了靜態泄漏,提高了開關速度,使效率達到了最高。在同樣的工藝水平中, 泄漏可以減少12%,速度提高17%,面積減少40%。與前一代90nm產品相比,靜態泄漏減少了50%,動態功耗降低70%,延遲縮短了45%。此外,通過過孔編程,切斷芯片內部閑置的單元和存儲器的供電,還采取時鐘選通控制睡眠模式、動態功率管理。Nextreme-2系列采用特許半導體的45nm低功耗工藝生產制造,其邏輯組織架構能夠提供高達700 MHz的性能。與最新工藝的FPGA相比,由于結合了三重氧化層晶體管、45nm 低功耗工藝和 eASIC 專利的功率管理結構, Nextreme-2的功耗可以降低80%以上。 Nextreme-2系列還嵌入了硬IP Core,包含多達56條 MGIO (多G比特輸入輸出口)。每條IO都能工作在6.5Gbps,總計提供364Gbps帶寬。在高性能網絡應用中,如交換機、路由器、流量管理、城域網傳輸設備和移動回程設備, 由于具備 MGIO (多G比特輸入輸出口),Nextreme-2 將成為 FPGAs 和 ASICs之外最佳的選擇。Nextreme-2主要特征如下:
如前所述,對所有的設計而言,Nextreme和Nextreme-2從硅片到每層金屬都是通用的,唯一不同的是一層過孔。封裝也是預先確定好的。從前端設計、后端設計一直到芯片制造, eASIC的Nextreme和Nextreme-2平臺是在成熟的EDA平臺上采用最嚴格的設計規則開發出來的。因此設計工程師完全不必擔心后端的問題,諸如可制造性設計DFM、可測試性設計DFT、光學鄰近效應修正OPC、生產良率控制等都由eASIC負責處理。eASIC提供了一個經過嚴格驗證和測試的平臺。迄今為止,客戶記錄一直是一次成功。 結束語 為了市場需求而創新的才有意義。eASIC掃平了深亞微米ASIC設計復雜、費用高昂等障礙,降低了ASIC門檻,同時解決了FPGA難以克服的靜態泄漏和高功耗。以其高性能、低功耗、低費用和快速上市時間等特點,標志著一個ASIC新紀元的開始。在深亞微米ASIC的競技場上,eASIC已經展現出其巨大的潛力,路越走越寬。我們有理由相信,eASIC正在逆轉衰退的ASIC設計趨勢。 |