自“千模大戰”興起,金融、醫療、教育等擁有數據積累的多領域企業,紛紛加入大模型隊伍,發布垂類大模型。垂類大模型以深度解決行業需求為主,即大模型需要具備豐富的專業領域知識,才可能創建出更符合特定垂類場景的“產業版GPT”。 不過,創建大模型并非易事,通常會面臨數據、計算資源、模型和算法設計、訓練時效、模型驗證調優等多方面問題,耗費大量人力、物力、財力后,依然效果甚微,而使用虎博科技的開源大模型Tigerbot則可得到解決,用戶最快可在30分鐘內無代碼的訓練和使用專屬于自己的大模型和數據。 據了解,虎博科技在發布開源大模型Tigerbot的同時,也發布了大模型應用開發所需的全套API,包括對話(Chat)、插件(Plug-ins)、微調(Fine-Tunes)等,并開放金融、法律、百科等多個專業領域數據,在高效果和高效率雙方面,為用戶提供了充分保障。 對話方面,Chat-API 為 TigerBot 對外提供的可直接使用的 api,支持 Tigerbot-7B 和 Tigerbot-180B 兩種模型的選擇;插件方面,除了Tigerbot提供的自研插件,可用api調用外,用戶還能管理自己的數據,訓練專屬插件;微調則更加人性化,用戶僅僅按照數據要求管理上傳自身數據,即可無代碼快速訓練出基于 TigerBot 大模型能力基礎的自己的模型。 Tigerbot是虎博科技自研的多語言多任務大規模語言模型,10人團隊歷經三個月超過3000次實驗后誕生。目前覆蓋生成、開放問答、編程、畫圖、翻譯、頭腦風暴等15大類能力,支持子任務超過60種。經測試體驗,Tigerbo能勝任寫廣告語、做表格、糾正語法錯誤等不同任務,也支持多模態文生圖的需求。 目前,虎博科技共推出70億參數(TigerBot-7B)和1800億參數(TigerBot-180B)兩種規模的模型。根據OpenAI InstructGPT 論文在公開 NLP 數據集上的自動評測,TigerBot-7B 版本已達到 OpenAI 同樣大小模型的綜合表現的 96%,尤其在推理式問答等個別領域表現更為亮眼,而這一版本還只是MVP(最小可行性模型)。 (上圖為公開 NLP 數據集上的自動評測,以OpenAI-instruct GPT-6B-SFT為基準,歸一化并平均各模型的得分情況) 虎博科技創始人兼CEO陳燁希望通過提供Tigerbot API構建生態藍圖,“大模型是人工智能時代的基礎設施,而生態的發展則能反哺大模型的能力,實現技術與產業發展的共榮共生,也可與廣大開發者一同打造中國的世界級應用。” 此外,Tigerbot在發布之際便開源,涉及模型、代碼、數據三部分內容,包含 TigerBot-7B-sft、 TigerBot-7B-base、TigerBot-180B-research 等多個模型版本;基本訓練且覆蓋雙卡推理 180B 模型的量化和推理代碼;以及達 100G 的預訓練數據、監督微調 1G/100 萬條數據。(開源地址:https://github.com/TigerResearch/TigerBot ) 據了解,虎博科技成立于2017年,以讓人們獲取知識更簡單為愿景,其專注于深度學習和NLP技術的研究和應用已得到了廣泛認可。此次自研大模型TigerBot發布并開源,更標志著這家專注于深度學習和自然語言處理技術的算法公司在大模型研發領域取得了重要突破。 |