近日,由Aitomatic公司及其“AI聯盟”合作伙伴共同開發的SemiKong正式發布。這一大型語言模型(LLM)是全球首個專為滿足半導體行業需求而精心打造的AI工具。 SemiKong基于Meta的Llama 3.1 LLM平臺構建,擁有700億參數。它的開發過程凝聚了多方力量,Aitomatic公司負責主導開發,而“AI聯盟”中的眾多合作伙伴也積極參與其中。“AI聯盟”于2023年成立,成員涵蓋了Meta、AMD、IBM等科技企業,還包括耶魯大學、東京大學等研究機構。該聯盟旨在構建、支持和倡導整個AI技術領域的開放式創新,以此抗衡英偉達在科技行業的主導地位。 SemiKong的核心目標在于融入半導體設計公司的工作流程,充當“數字專家”角色。它在半導體行業有著諸多重要意義。一方面,它能夠將新芯片設計的上市時間縮短20 - 30%,這無疑將極大地提高半導體行業的研發效率。另一方面,SemiKong可使首次投產成功率提高20%,同時把新工程師的學習曲線縮短高達50%,這對于半導體行業的人才培養和生產力提升有著積極的推動作用。 從技術角度來看,SemiKong的訓練過程主要分為預訓練領域知識、自我微調(指令數據集)、合并和量化這三個主要階段。盡管它有8B和70B兩個版本,但最近發布的700億參數版本已經展現出卓越的性能。它在準確性、相關性和對半導體工藝的理解方面都取得了顯著的進步。即使是其較小版本,在特定領域的應用中也常常超越較大的通用模型,這為那些想要打造適合自身的專有模型的芯片公司提供了一個極具價值的基座。 此外,SemiKong作為首個半導體專用的開源大模型,于2024年7月9日起在HuggingFace和GitHub上提供下載。它的問世不僅是Aitomatic公司及其“AI聯盟”合作伙伴的重要成果,也將為半導體行業的發展格局帶來新的變革機遇,有望重塑半導體制造業的未來。 |