国产毛片a精品毛-国产毛片黄片-国产毛片久久国产-国产毛片久久精品-青娱乐极品在线-青娱乐精品

AMEYA360報道:不同硬件的成本對比 ChatGPT炒熱GPU

發布時間:2023-2-22 14:54    發布者:Ameya360
  在機器學習推理場景中,除了GPU外,還有一大通用AI硬件適合這一負載,那就是FPGA。與GPU一樣,在技術和算法還未成熟且仍在打磨階段時,可以隨時重新編程改變芯片功能的FPGA架構前期硬件成本顯著低于GPU。在推理性能上,現如今的FPGA加速卡算力遠超CPU,甚至高過不少GPU產品。
  而且在ChatGPT這樣的聊天機器人應用上,將FPGA用于推理得以發揮其最大的優勢,那就是高吞吐量和低時延。更高的吞吐量和更低的時延也就意味著更大的并發,對ChatGPT這種應用來說可以極大增強其響應速度。

  但隨著算法和模型逐漸成熟,FPGA在成本上的優勢就慢慢不存在了,在大語言模型上需要用到更多的硬件,而FPGA量產規模的單價成本還是太高了,一旦擴充至成千上萬張加速卡,其成本也是不小的。比如AMD推出的新加速卡Alveo V70,據傳單卡價格就在2000美元左右。如果我們以INT8精度來衡量算力的話,假設ChatGPT需要28936塊A100 GPU,那么改用Alveo V70的話,也需要44693塊加速卡。

  所以還是有不少人將目光投向了量產規模成本更低的ASIC,比如谷歌就選擇用自研的TPU來部署其聊天機器人Bard。ASIC方案在單芯片算力上或許不是最高的,但計算效率卻是最高的,而且隨著量產化單片成本會逐漸降低。比如谷歌的單個TPU v4 Pod就集成了4096個TPU v4芯片,單芯片的BF16算力達到275TFLOPS,已經相當接近A100單卡峰值算力了。如果只是這樣簡單換算的話,只需幾個TPU v4 Pod,就能滿足與ChatGPT同量級的應用了。

  不過ASIC方案并沒有我們想象得那么美好,首先這類硬件的前期設計成本較大,要想投入數據中心商用,必須組建強大的硬件設計和軟件開發團隊,這樣才能有與GPU相抗衡的性能。其次,因為本身專用硬件的特性,專用于機器學習推理的ASIC方案很難最大化數據中心的硬件利用率,不像GPU還可以同時用于訓練、視頻編解碼等等。

本文地址:http://m.qingdxww.cn/thread-811219-1-1.html     【打印本頁】

本站部分文章為轉載或網友發布,目的在于傳遞和分享信息,并不代表本網贊同其觀點和對其真實性負責;文章版權歸原作者及原出處所有,如涉及作品內容、版權和其它問題,我們將根據著作權人的要求,第一時間更正或刪除。
您需要登錄后才可以發表評論 登錄 | 立即注冊

廠商推薦

  • Microchip視頻專區
  • 利用SAM E54 Xplained Pro評估工具包演示CAN轉USB橋接器以及基于CAN的主機和自舉程序應用程序
  • 使用SAM-IoT Wx v2開發板演示AWS IoT Core應用程序
  • 使用Harmony3加速TCP/IP應用的開發培訓教程
  • 集成高級模擬外設的PIC18F-Q71家族介紹培訓教程
  • 貿澤電子(Mouser)專區
關于我們  -  服務條款  -  使用指南  -  站點地圖  -  友情鏈接  -  聯系我們
電子工程網 © 版權所有   京ICP備16069177號 | 京公網安備11010502021702
快速回復 返回頂部 返回列表
主站蜘蛛池模板: 久久九九热re6这里有精品 | 日本一本免费一二区 | 成人国产精品久久久免费 | 国产卡一卡二卡3卡乱码免费 | 伊人小婷婷色香综合缴缴情 | 中文字幕一区日韩在线视频 | 99视频精品全部 在线 | 中文字幕视频一区 | 看免费人成va视频全 | 国产一区曰韩二区欧美三区 | 亚洲欧美小视频 | 久久香蕉国产线看观看亚洲卡 | 亚洲欧美男人天堂 | 亚洲福利视频一区二区 | 欧美一级做一级爱a做片性 欧美一级做一a做片性视频 | 日本无遮挡吸乳视频 | 黄瓜视频色www在线观看 | 欧美啪视频 | 99视频精品全部 在线 | 久草婷婷在线 | 侠盗高飞在线观看免费完整版 | 中文字幕第二区 | 国产成人午夜片在线观看 | 另类专区另类专区亚洲 | 国产三级精品三级在线专区1 | 国产欧美一区二区三区免费 | 婷婷热| 久久99热精品免费观看无卡顿 | 91高清视频| 轻点灬大ji巴太粗太大了小说 | 香蕉一区二区 | 亚洲成人欧美 | 青青青国产手机在线播放 | 91在线公开视频 | 岛国视频在线观看免费播放 | 国产精品综合网 | 久久久久99精品成人片三人毛片 | 国产精品一区二区在线观看完整版 | 手机看片1204日韩一区二区 | 女人高潮特级毛片 | 亚洲男女免费视频 |