虎博TigerBot-13B中文能力超Llama-2 49% 領(lǐng)先國內(nèi)外主流開源模型

發(fā)布時間：2023-8-10 17:20 發(fā)布者：科技新思路

近日，虎博科技發(fā)布開源大模型TigerBot-13B，此模型在Llama-2的基礎(chǔ)上以虎博積累的技術(shù)和數(shù)據(jù)繼續(xù)訓(xùn)練，不但保持了Llama-2出色的英文能力，更是在中文能力填補(bǔ)了Llama-2的不足，各項主流中文任務(wù)中超過Llama-2 的49%，在開源同類模型中具有競爭力�；⒉┑睦碚摵蛯嶒炋剿鞅砻鳎琓igerBot的訓(xùn)練方法，計算效率和數(shù)據(jù)達(dá)到世界上SOTA水平，本著open innovation的精神，虎博科技將這些成果分享給大模型社區(qū)，繼續(xù)開源和免費商用TigerBot-13B大模型。

本次發(fā)布包括以下三點：

TigerBot-13B-base: 基于Llama-2-13B繼續(xù)預(yù)訓(xùn)練300B tokens，擴(kuò)充了中文詞表到60K vocabulary, 并采用holistic training在預(yù)訓(xùn)練中直接使模型具有9成的指令完成能力。在主流英文基準(zhǔn)測試中超過Llama-2-13B-base的7%，在中文測試中綜合能力超過Llama-2-13B-base的49%，在國內(nèi)主流開源基座模型中處于領(lǐng)先位置。

TigerBot-13B-chat: 基于TigerBot-13B-base用5M指令數(shù)據(jù)微調(diào)，并采用rejection sampling fine-tune對齊人類需求。在主流英文基準(zhǔn)測試中達(dá)到Llama-2-13B-chat的 101%，在中文測試中綜合能力超過Llama-2-13B-chat的47%，在國內(nèi)主流開源模型中亦處于領(lǐng)先位置。

TigerBot-API: chat和summarization api 將自動升級到TigerBot-13B-chat，對科研教育用戶免費，對商用開發(fā)者保持價格不變。

本文地址：http://m.qingdxww.cn/thread-834575-1-1.html 【打印本頁】

本站部分文章為轉(zhuǎn)載或網(wǎng)友發(fā)布，目的在于傳遞和分享信息，并不代表本網(wǎng)贊同其觀點和對其真實性負(fù)責(zé)；文章版權(quán)歸原作者及原出處所有，如涉及作品內(nèi)容、版權(quán)和其它問題，我們將根據(jù)著作權(quán)人的要求，第一時間更正或刪除。

網(wǎng)友評論

貿(mào)澤電子有獎問答視頻，答對領(lǐng)10元微信紅包

廠商推薦

快速回復(fù) 返回頂部 返回列表

国产毛片a精品毛-国产毛片黄片-国产毛片久久国产-国产毛片久久精品-青娱乐极品在线-青娱乐精品

虎博TigerBot-13B中文能力超Llama-2 49% 領(lǐng)先國內(nèi)外主流開源模型

網(wǎng)友評論

廠商推薦