這大夏天的,人工智能(AI)有多火就不消多說了。 可人工智能不是鬧著玩的。例如,人工智能驅動的自動駕駛汽車干系到我們的身家性命。如何設計、建造穩定、可靠的人工智能系統,茲事體大馬虎不得。 和大多數設備一樣,人工智能系統的核心是半導體芯片。AI芯片十分龐大復雜,通常是以片上系統(SoC)的形式呈現。 目前,已經著手或打算從事AI芯片設計的公司數不勝數。然而,AI芯片設計絕非易事。今天這個情形有點類似于當年美國加州的淘金熱。每個人都想找到金礦,也都需要一把順手的淘金鏟。 賣“鏟子”的又來了。從所謂“正能量”的角度說,工欲善其事,必先利其器。如果你使用了正確的開發工具,那么你的SoC開發進程將變得順利而高效。 今天我們就介紹一家“賣鏟子”的公司,名叫NetSpeed。它成立于2011年,歷史不算長,但它已經贏得了諸多AI行業重量級客戶,僅中國的就包括百度、寒武紀和地平線。更重要的是,自動駕駛技術先行者特斯拉公司正在采用NetSpeed的軟件來設計4級完全自動駕駛芯片,該芯片將于2020年面世。NetSpeed聲稱,全球最成功的SoC設計者在使用NetSpeed技術。 NetSpeed是一家什么樣的公司呢?近日,NetSpeed Systems公司大中華區銷售總監黃啟弘先生向我們介紹了NetSpeed公司及其剛剛發布的Orion AI系統級IP。 黃先生介紹說,NetSpeed總部位于美國硅谷的圣何塞市,創始人曾就職于華為、Cisco這樣的通信系統公司。創始人之一、現任CTO Sailesh Kumar先生曾是華為100G服務網絡處理器芯片組的智能存儲子系統主席架構師,精于IP轉發、深度包監測、存儲系統和高速系統的算法。 正是由于創始人在通信公司的經歷,NetSpeed把互聯網思維應用到了芯片設計上。他們的目標是,讓數據在SoC內部暢通無阻。 黃先生介紹說,AI芯片的設計難點之一在于芯片內部各個單元之間的互聯。人工智能的訓練和推理都需要做大型矩陣乘法運算,其產生的數據量極大。芯片內部的處理內核數量多,存在大量并行結構和點對點運算。在這種情況下,芯片內部互聯要求極高帶寬。將來,這種情形會愈演愈烈。 NetSpeed的Orion AI系統級IP就是針對SoC內部的非一致性互聯而開發。其特點是采用解耦架構、可編程多播和非凡的QoS,達到極致性能和極致效率。Orion AI據稱可以達到TB/s的吞吐量,實現數據帶寬高達1024位的總線,支持1000個內核。 如下圖所示,Orion AI的獨有技術包括:可編程多播(multi-cast),動態控制下一點到多點的傳播以提高效率;無需回應發送信息模式,讓數據傳輸更加順暢;先進的QoS規劃,確保數據包傳輸到位,而且準確無誤。 為達到這樣的高性能,Orion AI內置工智能,利用人工智能算法搜尋最有效的解決方案。黃先生說,NetSpeed為中國客戶提供不加密的Orion AI版本,用戶在自己的服務器上即可運行。Orion AI生成的文件可以進行手工修改以完成進一步優化。他說,采用Orion AI,用戶可以節省數月的開發時間,大大加速SoC的開發進程。 |