解密華為Atlas 900:數(shù)千顆昇騰910構成全球最快AI訓練集群
9月18日消息(記者 趙晉杰)在9月18日開幕的華為全聯(lián)接2019大會上,號稱全球最快AI訓練集群華為Atlas 900發(fā)布。它是如何構成的,有哪些優(yōu)勢,又能被應用到哪些領域,下面讓我們來一一解密。
集成數(shù)千顆昇騰910AI處理器
Atlas 900 AI訓練集群,由數(shù)千顆昇騰910 AI處理器互聯(lián)構成,最終成為當前全球最快的AI訓練集群,代表了當今全球的算力巔峰。其總算力達到256P~1024P FLOPS @FP16,相當于50萬臺PC的計算能力。
目前,華為已在華為云上部署了一個Atlas 900 AI訓練集群,集群規(guī)模為1024顆昇騰910 AI處理器;诋斍白畹湫偷腞esNet-50 v1.5模型”和“ ImageNet-1k數(shù)據集”,Atlas 900AI訓練集群只需59.8秒就可完成訓練,排名全球第一。
“ ImageNet-1k數(shù)據集”包含128萬張圖片,精度為75.9%,在同等精度下,其他兩家業(yè)界主流廠家測試成績分別是70.2s和76.8s,Atlas 900 AI訓練集群比第2名快15%。
Atlas 900 AI訓練集群領先技術優(yōu)勢
首先是AI算力業(yè)界領先。Atlas 900 AI訓練集群采用業(yè)界單芯片算力最強的昇騰910 AI處理器,每顆昇騰910 AI處理器內置32個達芬奇AI Core,單芯片提供比業(yè)界高一倍的算力(256TFLOPS@FP16)。其次是最佳集群網絡。Atlas 900 AI訓練集群采用“HCCS、 PCIe 4.0、100G以太”三類高速互聯(lián)方式,百TB全互聯(lián)無阻塞專屬參數(shù)同步網絡,降低網絡時延,梯度同步時延縮短10~70%。此外還有系統(tǒng)級調優(yōu)。Atlas 900 AI訓練集群通過華為集合通信庫和作業(yè)調度平臺,整合HCCS、 PCIe 4.0 和100G RoCE三種高速接口,充分釋放昇騰910 AI處理器的強大性能。最后是極致散熱系統(tǒng)。Atlas 900 AI訓練集群采用全液冷方案,創(chuàng)新性設計業(yè)界最強柜級密閉絕熱技術,支撐>95%液冷占比。單機柜支持高達50kW超高散熱功耗,實現(xiàn)PUE<1.1的極致數(shù)據中心能源效率。
Atlas 900 AI 集群適用場景
Atlas 900 AI集群主要為大型數(shù)據集神經網絡訓練提供超強算力,可廣泛應用于科學研究與商業(yè)創(chuàng)新,讓研究人員更快地進行圖像、視頻和語音等AI模型訓練,可被應用于探索宇宙奧秘、預測天氣、勘探石油和加速自動駕駛的商用進程。
如在天文探索方面,在一張匯聚有20萬顆星星的南半球星空圖上,天文學家想找出某種特征的星體,需要169天的工作量。Atlas 900,只需要10秒。

請輸入評論內容...
請輸入評論/評論長度6~500個字
最新活動更多
推薦專題
- 1 AI 眼鏡讓百萬 APP「集體失業(yè)」?
- 2 大廠紛紛入局,百度、阿里、字節(jié)搶奪Agent話語權
- 3 深度報告|中國AI產業(yè)正在崛起成全球力量,市場潛力和關鍵挑戰(zhàn)有哪些?
- 4 上海跑出80億超級獨角獸:獲上市公司戰(zhàn)投,干人形機器人
- 5 國家數(shù)據局局長劉烈宏調研格創(chuàng)東智
- 6 下一代入口之戰(zhàn):大廠為何紛紛押注智能體?
- 7 百億AI芯片訂單,瘋狂傾銷中東?
- 8 Robotaxi新消息密集釋放,量產元年誰在領跑?
- 9 格斗大賽出圈!人形機器人致命短板曝光:頭腦過于簡單
- 10 一文看懂視覺語言動作模型(VLA)及其應用