近日,天翼云DeepSeek模型推理技術迎來重大升級。該技術不僅支撐DeepSeek-R1滿血版模型實現性能的四倍提升,更將大規模部署模型的成本降至原來的25%以下,為AI應用落地鋪就更為寬廣的道路。 此次技術升級主要體現在量化技術賦能及通信傳輸優化兩大層面。其中,天翼云針對模型的浮點計算進行深度優化,使用高效量化算法,大幅減少計算資源消耗,提升推理速度,同時保證性能不打折。 通信傳輸方面,天翼云通過優化通信算子編排與通信方式,顯著提升MoE模型推理中的通信效率,助力DeepSeek-R1模型的整體處理能力再上新臺階。 基于兩大技術升級,天翼云提供的DeepSeek-R1滿血昇騰版每實例性能提升至原版本207%,首字輸出仍保持百毫秒級響應;每實例部署所需機器數減少一半,僅為兩臺。 此次升級DeepSeek-R1為行業的大規模AI應用提供了更完善的解決方案。DeepSeek-R1滿血昇騰版整體部署成本降至原來25%以下,意味著企業可以在不增加太多預算的情況下,享受到更強大、更高效的AI服務,加速了AI技術的普及與應用。 目前,天翼云“息壤”智算平臺已有多款產品支持部署DeepSeek,為行業提供了性能卓越、安全可控的智能算力基座,以普惠AI應用服務,不斷促進國產AI生態繁榮。 科技創新的目標是解決實際應用,促進行業進步。天翼云始終堅持科技創新,將技術升級與市場需求緊密結合,加速AI技術從理論走向實踐,從實驗室走向生產線。未來,天翼云將繼續探索更多前沿AI技術路徑,為廣大開發者和用戶提供更優質、更具性價比的模型服務,推動AI應用普惠化,共筑數字中國的智慧未來。 |