芯片工程師展示了一個高度專業化的行業如何使用 NVIDIA NeMo 來定制大語言模型,以獲得競爭優勢。 10 月 31 日,NVIDIA 發布的一篇研究論文描述了生成式 AI 如何助力芯片設計,后者是當今最復雜的工程工作之一。 這項工作展示了高度專業化領域的公司如何利用內部數據訓練大語言模型,從而開發提高生產力的 AI 助手。 像半導體設計這樣如此具有挑戰性的工作并不多見。在顯微鏡下,NVIDIA H100 Tensor Core GPU(上圖)這樣最先進的芯片看起來就像一個精心規劃的大都市,由數百億個晶體管組成,把它們連接起來的線比人的頭發絲還細 1 萬倍。 多個工程團隊進行協作,需要長達兩年的時間才能構建出這樣一個數字化超級大都市。 一些小組定義芯片的整體架構,一些小組負責各種超小型電路的設計與布局,還有一些小組負責測試工作。每項工作都需要采取專門的方法、軟件程序和計算機語言。 大語言模型廣闊的前景 該論文的主要作者、NVIDIA 研究總監 Mark Ren 表示:“我相信,隨著時間的推移,大語言模型將全面助力所有流程。” 在同日舉行的國際計算機輔助設計會議上,NVIDIA 首席科學家 Bill Dally 發表主題演講并公布了這篇論文。這個年度盛會每年都會吸引數百名電子設計自動化(EDA)領域的工程師參加。 此次會議在舊金山舉行。Dally 在會上表示:“這標志著在將大語言模型用于復雜的半導體設計方面邁出了重要一步。這項工作表明,即使高度專業化的領域也可以利用內部數據來訓練極具價值的生成式 AI 模型。” ChipNeMo 浮出水面 這篇論文詳細介紹了 NVIDIA 工程師如何創建名為 ChipNeMo 的定制大語言模型,供內部使用。該模型使用公司內部數據進行訓練并生成和優化軟件,以更好地協助人類設計師。 Ren 在 EDA 領域從業超過 20 多年,他表示,從長遠來看,工程師們希望生成式 AI 能夠用于芯片設計的各個階段,從而大幅提升整體生產力。 在針對可能的使用場景對 NVIDIA 工程師進行調研之后,研究團隊一開始選擇了三個場景:聊天機器人、代碼生成器和分析工具。 初始用例 維護已知 bug 的更新描述需要耗費大量時間,而上述分析工具中的后者能夠實現此類任務的自動化,并已得到廣泛的采用。 一個聊天機器人原型可以回答有關 GPU 架構和設計的問題,并且已經幫助許多工程師在早期測試中快速找到技術文檔。 代碼生成器將幫助設計者編寫芯片設計軟件。 一個正在開發中的代碼生成器(如上圖所演示)已經用兩種芯片設計師專用語言創建了大約 10-20 行軟件的片段。它將與現有工具集成,為工程師們提供一個方便的助手來進行設計。 使用 NVIDIA NeMo 定制 AI 模型 這篇論文主要關注該團隊收集設計數據并使用這些數據創建專門的生成式 AI 模型,這個過程可以移植到任何行業。 作為起點,該團隊選擇了一個基礎模型,并使用 NVIDIA NeMo 對其進行了定制。作為 NVIDIA AI Enterprise 軟件平臺的一部分,NVIDIA NeMo 是一個用于構建、定制和部署生成式 AI 模型的框架。定的 NeMo 模型具有 430 億個參數,這衡量了它對模式的理解力。它使用超過一萬億個文本和軟件中的 token、單詞和符號進行了訓練。 ChipNeMo 提供了一個技術團隊如何用自己的數據改進預訓練模型的示例。 然后,該團隊在兩輪訓練中完善了該模型。第一輪使用了相當于大約 240 億個 token 的內部設計數據,第二輪使用了約 13 萬個對話和設計示例。 這項工作是半導體行業進行生成式 AI 概念研究和印證的幾個例子之一, 這一趨勢剛剛開始在實驗室興起。 分享經驗 Ren 的團隊學到的一個最重要的經驗就是定制大語言模型的重要性。 在芯片設計任務中,只有 130 億個參數的定制 ChipNeMo 模型的性能達到或超過了更大的通用大語言模型(例如包含 700 億個參數的 LLaMA2)。在某些使用場景中,ChipNeMo 模型甚至好很多。 他補充道,在這一過程中,用戶需要謹慎地確定他們收集什么數據以及如何清理數據以用于訓練。 最后,Ren 建議用戶及時了解可以加快和簡化工作的最新工具。 NVIDIA Research 在全球各地擁有數百名科學家和工程師,專注于 AI、計算機圖形學、計算機視覺、自動駕駛汽車、機器人學等領域。近期的其它半導體項目包括使用 AI 設計更小、更快的電路,以及優化大型模塊的布局。 希望構建自己的定制大語言模型的企業現在可以從使用 GitHub 和 NVIDIA NGC 目錄中的 NeMo 框架開始。 |