商湯科技發布“日日新SenseNova 4.0”,多維度全面升級大模型體系。 “日日新SenseNova 4.0”擁有更全⾯的知識覆蓋、更可靠的推理能⼒,更優越的長⽂本理解力及更穩定的數字推理能⼒和更強的代碼⽣成能⼒,并⽀持跨模態交互。日日新·商量大語言模型-通用版本(SenseChat V4),支持128K語境窗口長度,綜合整體評測成績水平比肩 GPT 4,相較GPT 3.5已經實現全⾯超越。(API申請網址:https://platform.sensenova.cn/) 商湯還率先推出了支持不同模態工具調用的⽇⽇新·商量大語言模型Function call & Assistants API 版本,為先進的大模型與各類應用服務工具的連接提供便利橋梁,顯著降低開發者使用大模型的門檻。 商湯也將先進的大模型能力轉化為落地實際場景的產品應用,基于最新發布的⽇⽇新·商量大語言模型Function call & Assistants API 完成開發并發布數據分析工具“辦公小浣熊”。 目前,憑借豐富的AI技術能力,商湯“日日新Sense Nova”大模型體系以低成本、高效率打通了各類AI應用,提供包括:面向辦公場景的商湯⽇⽇新·商量語⾔⼤模型-數據分析版本、面向醫療場景的日日新·商量語言大模型-醫療版本“大醫”、 面向自動駕駛及工業場景的日日新·商量多模態大模型,以及面向創作創意場景的日日新·秒畫文生圖大模型等豐富的工具。 商湯“⽇⽇新·商量大語言模型”在金融、手機、醫療、汽車、地產、能源、傳媒、工業制造等眾多垂直行業,已與超過500家客戶建立深度合作,加速行業企業的智能化轉型。 接下來,商湯“日日新SenseNova”大模型體系及相關產品和工具為實現通用人工智能(AGI)提供了精準著力點,助力全場景、多產業實現“大模型+”,拓寬大模型應用邊界。 “節前大上新”!超豐富大模型體系,AI能力隨取隨用 “日日新SenseNova 4.0”提供了多種靈活的API接口和服務,開發人員可以根據實際應用需求,輕松地調用日日新SenseNova大模型的各項AI技術能力,以更低成本、更高效率實現各類AI應用。 大模型性能提升的基礎,在于語言建模能力的增強。“日日新SenseNova4.0”全新升級日日新·商量大語言模型-通用版本(SenseChat V4),目前支持4k、32k、128k tokens不同窗口,拓展了模型應用范圍。SenseChat V4 顯著提升了在知識理解、閱讀理解、綜合推理、數理、代碼和長文本理解等領域的通用能力,綜合整體評測成績水平比肩GPT-4 ,其中推理和代碼編程的測評表現更是超越了GPT-4。在權威測試集HumanEval Coding的測試中,一次通過率達到75.6%(GPT-4此項數據為74.4%)。 基于大模型評測平臺OpenCompass全集測試,日日新·商量大語言模型SenseChat V4,綜合整體評測成績水平比肩GPT-4 商湯⽇⽇新·商量語⾔⼤模型-數據分析版本(SenseChat-DataAnalysis V4)發布,在數據分析場景下的數據測試集(1000+題目)中以85.71%的正確率超過GPT-4,支持復雜表格、多表格、多文件的理解,實現數據清洗、數據運算、比較分析、趨勢分析,預測性分析、可視化等常見數據分析任務,賦能財務分析、商業分析、銷售預測、市場分析、宏觀分析等多個應用場景。 商湯推出的日日新·商量語言大模型-醫療版本“大醫”(SenseChat-Medical V4),在本次更新中實現了更強的多輪對話與上下文理解能力、以及更豐富的工具調用能力,有效實現專業醫學問答及復雜醫學任務推理,并支持更多模態醫學文件的智能解讀和交互問答。“大醫”在兩項行業權威評測——2023年職業藥劑師考試大模型評測、中文醫療大語言模型開放評測平臺MedBench中,均實現綜合評分排名第二,性能逼近GPT-4,其中職業藥劑師考試大模型評測中的兩個細分方向性能已超越GPT-4。 2023年職業藥劑師考試大模型評測結果,“大醫”綜合評分排名第二,并在兩個細分方向上性能超越GPT-4 覆蓋13個醫學場景的大醫Web端展示頁面 多模態是人工智能大模型重要的技術演進方向,日日新·商量多模態大模型(SenseChat-Vision V4)全新推出,其擁有300億參數,圖文理解能力處于全球領先水平,在權威評測基準測試集MME Benchmark上綜合得分排名首位,綜合得分達2199.5(超過GPT-4V的1926.57),已在智能駕駛、智能車艙、電力行業等多個實際場景落地應用,助力千行百業的產業升級。 多模態大模型權威綜合基準測試MME Benchmark可以從定位、名人識別、景點識別、OCR、數學計算等14個維度來系統綜合評測模型的能力。 日日新·商量多模態大模型可回答交通場景中圖文內容理解等復雜任務 商湯自研的日日新·秒畫文生圖大模型(SenseMirage V4)較此前版本,參數量提升至百億量級,通過Mixture of text experts、Spatial-aware CFG等算法優化,語義理解能力與圖像質感細節表現顯著增強,可達成電影級海報生成水平。同時結合Adversarial Distillation算法,秒畫SenseMirage-Turbo V4版本也對外發布,相較于V4基礎版本,可達到10倍推理加速效果。 秒畫SenseMirage V4全新升級,電影級圖片一鍵生成 率先支持不同模態工具調用的Function call & Assistants API 版本來了,大模型時代的專屬開發助手 大模型的能力前沿且豐富,為助力更多開發人員及相關行業更便捷、高效地用好大模型,商湯推出⽇⽇新·商量大語言模型Function call & Assistants API 版本。 ⽇⽇新·商量大語言模型Function call & Assistants API 版本為開發人員提供一個靈活、高度可定制的工具調用框架,提供了聯網搜索,代碼解釋,圖文問答,⽂⽣圖等多種⼯具調⽤,⽀持商湯⽇⽇新⼤模型體系,賦能多⾏業場景。 與其他同類產品相比,⽇⽇新·商量大語言模型Function call & Assistants API 版本率先支持不同模態的工具調用,能夠支持圖文結合的多模態交互和數據分析代碼執行結果的直觀呈現,從而解決更加復雜的問題,讓各種應⽤程序中集成AI功能變得更加簡單和⾼效。 通過⽇⽇新·商量大語言模型Function call & Assistants API,輕松調用內置工具實現多模態交互(注:展示效果有加速處理) 創新場景應用加速落地,商湯“日日新”大模型體系持續賦能多產業升級 大模型的出現帶來了人機交互范式的巨大轉換,依托商湯“日日新Sensenova”能力的快速迭代,小浣熊家族再添新成員——數據分析工具 “辦公小浣熊”,重塑大模型時代的應用產品形態。 辦公小浣熊是一款無需編程或復雜操作即可使用的數據分析工具。通過自然語言輸入,辦公小浣熊結合商湯大模型體系的意圖識別、邏輯理解、代碼生成能力,自動將數據轉化為有意義的分析結果和可視化圖表。得益于商湯大模型體系的強大中文理解能力,該產品更適應中國的數據分析需求。 辦公小浣熊演示頁面:輸入表格,輕松get 分析報告。體驗入口:https://raccoon.sensetime.com/ 產品形態的出現是大模型技術落地應用的嘗試之一,自2023年4月10日商湯“日日新SenseNova”問世以來,企業用戶超過3000家,覆蓋行業包括互聯網、游戲、文旅、教育、醫療健康、金融和編程等。 商湯始終推動降低大模型使用門檻,拓展人工智能落地場景,讓大模型真正在行業里用起來,未來將持續推進“日日新SenseNova”大模型體系建設,實現創新場景應用,不斷推動大模型前置化,讓更多智能走向更多場景、更多行業,攜手行業生態邁向AGI時代。 |