[color=rgba(0, 0, 0, 0.65)]5月6日,訊飛星火認知大模型成果發布會在安徽合肥舉行,現場實測大模型七大核心能力,并發布了汽車、教育、辦公、數字員工四大行業應用成果。 [color=rgba(0, 0, 0, 0.65)]作為新推出人工智能大模型,訊飛星火我帶來了驚喜!特別是在教育、文本創造、多輪對話等方面的回答,確實“有點東西”;甚至有一些回答,令人拍案叫絕。官方表示,訊飛星火生成式訓練模型是1+N模式,“1”是通用認知智能大模型,算法研發及高效訓練底座平臺,“N”是應用于教育,醫療,人際交互,辦公等多個領域的專業大模型。從這段話中能看得出來,訊飛星火的特色是教育,醫療,人際交互和辦公。 [color=rgba(0, 0, 0, 0.65)]那備受矚目的訊飛星火認知大模型在目前已知的AI大模型相比,實力究竟如何呢?人工智能大模型有沒有官方統一的評測標準?5月9日,中文通用大模型綜合性評測基準SuperCLUE正式發布為我們解開了困惑。 [color=rgba(0, 0, 0, 0.65)]中文通用大模型綜合性評測基準SuperCLUE主要關注以下問題:中文大模型在不同任務上的表現如何?與國際代表性模型相比,中文大模型的表現達到了何種程度?中文大模型與人類表現相比如何?包括但不限于:這些模型不同任務的效果情況、相較于國際上的代表性模型做到了什么程度、 這些模型與人類的效果對比。 [color=rgba(0, 0, 0, 0.65)]SuperCLUE從三個不同的維度評價模型的能力:基礎能力、專業能力和中文特性能力。其中專業能力包括中學、大學與專業考試,涵蓋了從數學、物理、地理到社會科學等50多項能力。其發布的總榜單顯示,GPT-4排名第一,ChatGPT排名第二,星火認知大模型緊隨其后排名第三,也充分說明了星火大模型盡管和GPT還有差距,但已經是國產大模型的佼佼者。此外,資本市場也在“用腳投票”,發布會后的第一個交易日,科大訊飛股票隨即漲停,正是對科大訊飛大模型技術實力的認可。 [color=rgba(0, 0, 0, 0.65)]在星火大模型發布會上,科大訊飛董事長劉慶峰就向我們展示了星火認知大模型的商業落地成果。也坦言,目前大模型技術還有待攻克的缺陷,比如新知識難以及時更新、事實類問答容易“張冠李戴”,史實、傳統典籍等容易“編造情節”等,但這些問題在今年會有明顯的改進。此外,星火大模型才剛剛發布,現在談對標ChatGPT也為時過早。 [color=rgba(0, 0, 0, 0.65)]任何行業的開創之路都充滿艱辛,挑戰與機遇并存。從零開始創建,需要經歷無數的困難和挫折。然而,正是這些艱難險阻,塑造了科大訊飛更加堅韌的品質,變得更加有毅力、有信心在人工智能大模型的路上一往無前。二十多年的堅持不懈,才是科大訊飛取得今日成就的關鍵!訊飛星火認知大模型的上線也向世界證明,中國的AI技術已經起飛! |