隨著神舟十二號發(fā)射成功,HPDA開始走入大眾視野
北京時間6月17日9時22分,神舟十二號載人飛船發(fā)射成功!這是時隔5年之后,中國再一次把航天員送入太空。這一次的與眾不同之處還在于,三名航天員將成為中國空間站天和核心艙的首批入駐人員,在軌駐留3個月。
從“天問一號”首次進行火星探測,到此次航天員首次駐留空間站,我國在宇宙探測方面不斷實現(xiàn)驚人的突破。而在這背后,從宇宙探索到深空探秘,意味著海量數(shù)據(jù)的產(chǎn)生、存儲和分析,高性能計算(HPC)與存儲就成了不可或缺的工具。
HPC與數(shù)據(jù)分析的深度結(jié)合,推動了HPDA(High Performance Data Analytics,高性能數(shù)據(jù)分析)的興起和快速發(fā)展。作為HPC領(lǐng)域最具潛力的一個分支,HPDA正在航天遙感、天氣與氣候建模、個性化醫(yī)療、金融欺詐檢測、電子商務(wù)等多個領(lǐng)域得到越來越廣泛且深入的應(yīng)用。
HPDA熱起來
HPDA其實并不是一個新概念。早在2014年,市場研究機構(gòu)IDC就已經(jīng)指出,各大行業(yè)頭部企業(yè)正在積極利用HPC技術(shù)向大數(shù)據(jù)分析類工作負(fù)載發(fā)起挑戰(zhàn),而HPDA存儲作為高端存儲市場的一股清流,將迎來迅速發(fā)展的機遇期。最新的市場調(diào)研發(fā)現(xiàn),67%的HPC用戶都在使用HPDA,而非傳統(tǒng)的HPC。HPDA快速增長的最主要動力就是HPC最擅長的數(shù)據(jù)密集型應(yīng)用。
在人工智能、大數(shù)據(jù)時代,企業(yè)對于數(shù)據(jù)有了更深刻的認(rèn)知——數(shù)據(jù)已成為企業(yè)的戰(zhàn)略資產(chǎn)。全球知名市場研究機構(gòu)ESG的調(diào)查數(shù)據(jù)顯示,23%的企業(yè)認(rèn)為,數(shù)據(jù)就是他們的業(yè)務(wù),另有26%的企業(yè)認(rèn)為,數(shù)據(jù)既是其業(yè)務(wù),也用于支持其業(yè)務(wù)。數(shù)據(jù)驅(qū)動業(yè)務(wù)不再是一句空話,而數(shù)據(jù)以及數(shù)據(jù)存儲對于推動企業(yè)業(yè)務(wù)的創(chuàng)新與發(fā)展至關(guān)重要。
若想充分挖掘數(shù)據(jù)的潛能和價值,首先要有海量的數(shù)據(jù),其次還要有強大的算力和AI能力,支撐對于數(shù)據(jù)的分析。一句話,讓數(shù)據(jù)轉(zhuǎn)變成具有意義的洞察,就需要借助HPC這樣的技術(shù)進行實時的分析、預(yù)測。從以計算為中心到以數(shù)據(jù)中心心,HPC正在發(fā)生具有轉(zhuǎn)折性意義的演進,這是數(shù)據(jù)密集型應(yīng)用需求的驅(qū)動,也是大數(shù)據(jù)、AI等技術(shù)發(fā)展使然。
ESG的調(diào)查數(shù)據(jù)顯示,63%的受訪者表示,2021年在人工智能和機器學(xué)習(xí)方面的支出比上一年有所增加,這將導(dǎo)致數(shù)據(jù)量的進一步增長。你可能想象不到,L4自動駕駛數(shù)據(jù)集已經(jīng)增長到EB級,單個現(xiàn)代基因組測序儀每天能夠生成6TB的數(shù)據(jù)……海量數(shù)據(jù)的處理為HPDA創(chuàng)造了巨大的商機,商業(yè)智能、數(shù)據(jù)發(fā)現(xiàn)與挖掘、搜索分析、行為分析、交互式查詢等都成了最好的用武之地。
真金不怕火煉
但是任何事物的發(fā)展都具有兩面性,數(shù)據(jù)密集型業(yè)務(wù)的快速發(fā)展,讓存儲系統(tǒng)的壓力與日俱增。隨著數(shù)據(jù)量激增,尤其是非結(jié)構(gòu)化數(shù)據(jù)的爆炸性增長,數(shù)據(jù)分析效率、數(shù)據(jù)管理、安全存儲等成為亟待突破的瓶頸。
誰能化解數(shù)據(jù)密集型HPC帶來的存儲挑戰(zhàn)?HPDA存儲唯有“輕裝上陣”——更經(jīng)濟、更可靠,同時還能有效處理各種負(fù)載,即使面對HPC業(yè)務(wù)流程細(xì)分和多種應(yīng)用場景集成產(chǎn)生的復(fù)雜混合負(fù)載,也能游刃有余,既能從容應(yīng)對大文件、高帶寬的需求,也能在小文件、高IOPS的環(huán)境中大顯身手。
那么,在一眾HPDA存儲中,誰又能堪當(dāng)大任呢?只用實際測試和驗證效果說話的ESG給出了它的解析。
在存儲領(lǐng)域有很多調(diào)研和評測機構(gòu),它們會從不同的維度對存儲系統(tǒng)給出評價,有的以IOPS性能測試見長,有的以用戶的實際評價作為評判標(biāo)準(zhǔn),ESG則獨樹一幟,通常會搭建嚴(yán)格的接近于真實的應(yīng)用環(huán)境,對產(chǎn)品進行全面測試后才會得出最終結(jié)論。經(jīng)過這樣一番洗禮,這回華為OceanStor Pacific下一代HPDA存儲真的要“出圈”了。
ESG從性能、可靠性、數(shù)據(jù)管理以及整體擁有成本(TCO)等多個維度對華為 OceanStor Pacific進行了一次全面“體檢”,還專門測試了OceanStor Pacific為數(shù)據(jù)密集型應(yīng)用提供不同協(xié)議訪問的性能,并對五年TCO進行了深入分析。
ESG測試環(huán)境
真金不怕火煉,OceanStor Pacific經(jīng)受住了考驗。在不影響存儲性能的情況下,OceanStor Pacific可以有效滿足用戶對于海量非結(jié)構(gòu)化數(shù)據(jù)在數(shù)據(jù)保護、數(shù)據(jù)遷移、硬件成本和快速增長等方面的核心需求。在模擬真實應(yīng)用環(huán)境的測試中,單套OceanStor Pacific存儲系統(tǒng)能夠為多種業(yè)務(wù)提供高性能、低時延,并在多協(xié)議間提供一致的語義。ESG對于OceanStor Pacific在面對多種文件/對象協(xié)議時均能提供一致的性能,且所有協(xié)議都幾乎性能無損這一點印象十分深刻。
以前,企業(yè)用戶在處理海量非結(jié)構(gòu)化數(shù)據(jù)時,都習(xí)慣采用橫向擴展NAS系統(tǒng)。但是隨著工作負(fù)載越來越復(fù)雜,數(shù)據(jù)量持續(xù)增加,用戶對于存儲性能的一致性、靈活擴展能力、成本效益以及可用性等提出了更高的要求。
比如在汽車、飛機的設(shè)計和制造方面,越來越多的企業(yè)希望用HPC技術(shù)支撐復(fù)雜的設(shè)計、分析,進一步提高產(chǎn)品的設(shè)計質(zhì)量;在商業(yè)領(lǐng)域,企業(yè)傾向于借助大數(shù)據(jù)、深度學(xué)習(xí)等技術(shù),對客戶行為進行畫像,或者進行更加細(xì)粒度和精確的搜索等。這些都是最典型的HPDA存儲的應(yīng)用場景。ESG建議用戶,采用專為HPDA設(shè)計的下一代存儲系統(tǒng),在提升可用性的同時可以減少工作量,提高容量和性能的同時還能有效降低存儲TCO。而華為OceanStor Pacific正是HPDA業(yè)務(wù)的理想之選。
魚與熊掌可兼得
俗話說,光說不練假把式。華為OceanStor Pacific在ESG的測試中到底表現(xiàn)如何?
OceanStor Pacific存儲系統(tǒng)的獨特之處在于,能夠提供各種數(shù)據(jù)密集型場景所需的高性能和靈活訪問能力,包括HPC、AI/ML、大數(shù)據(jù)分析、大規(guī)模虛擬化、內(nèi)容存儲、地震分析、生命科學(xué)、金融,以及任何需要存儲海量數(shù)據(jù)并提供高性能、多協(xié)議訪問的應(yīng)用。特別需要指出的是,OceanStor Pacific的企業(yè)級可用性功能在軟件中實施,從而提供一個平臺以極低的延遲對業(yè)務(wù)關(guān)鍵型及任務(wù)關(guān)鍵型負(fù)載與海量數(shù)據(jù)集進行整合。
ESG的實際測試有力地驗證了上述OceanStor Pacific的定位和特色,OceanStor Pacific確實可以為超大數(shù)據(jù)集提供持續(xù)的高性能,并充分支持以數(shù)據(jù)為中心的實際應(yīng)用。
先看對多協(xié)議的支持。在自動駕駛、精密醫(yī)療、智能制造等典型的企業(yè)HPDA應(yīng)用場景中,數(shù)據(jù)流程的不同階段通常會使用到文件、對象和大數(shù)據(jù)(HDFS)等服務(wù)。
像OceanStor Pacific這樣具有多協(xié)議互通能力的存儲系統(tǒng),能夠無縫支持NFS、CIFS、HDFS和S3等協(xié)議,并允許應(yīng)用通過多個協(xié)議共享一份數(shù)據(jù),從而達(dá)到提高分析效率的目的,在無數(shù)據(jù)遷移的情況下,可以通過多個協(xié)議進行讀取,同時保證語義無損和高穩(wěn)定的性能。ESG的測試表明,OceanStor Pacific在單個高性能高可用平臺上具有整合異構(gòu)數(shù)據(jù)密集型負(fù)載的超強能力,能夠同時處理多種負(fù)載,并且保證使用多種協(xié)議訪問的穩(wěn)定的數(shù)據(jù)性能。
再看對混合負(fù)載的支持。通常情況下,HPC負(fù)載具有多樣性的特點,比如地震數(shù)據(jù)處理需要高帶寬,而對已處理數(shù)據(jù)的解釋則需要高IOPS。帶寬瓶頸可能是由網(wǎng)絡(luò)、磁盤或內(nèi)存不足造成的,而IOPS瓶頸則可能是因CPU算力不足或調(diào)用堆棧深度等軟件問題引起的。解決不同的性能瓶頸,這對華為OceanStor Pacific來說并不是一件難事。ESG的測試顯示,OceanStor Pacific文件系統(tǒng)采用元數(shù)據(jù)分布、大小I/O分流、磁盤索引等技術(shù),可以同時滿足高帶寬和高IOPS的需求,可謂魚與熊掌兼得。
最后驗證高密度設(shè)計和TCO。為了有效應(yīng)對海量數(shù)據(jù)的增長,存儲的高密度設(shè)計幾乎成了標(biāo)配。華為OceanStor Pacific采用了下一代高密度硬件架構(gòu):華為自研的half-palm NVMe盤,將橫截面減少65%;領(lǐng)先的散熱材料、創(chuàng)新的風(fēng)扇布局和全新的結(jié)構(gòu)設(shè)計,可以將整個存儲系統(tǒng)的冷卻效率提高30%;采用EC和端到端數(shù)據(jù)完整性字段(DIF),將磁盤利用率提升至91.6%……
根據(jù)不同的業(yè)務(wù)場景,OceanStor Pacific提供兩種高密度硬件架構(gòu)配置:一個是高密性能型的OceanStor Pacific 9950,每機箱可提供高達(dá)160GB/s帶寬和200萬IOPS的極速數(shù)據(jù)訪問;另一個是高密容量型的OceanStor Pacific 9550,在5U空間內(nèi)可提供超過1.6PB的裸容量。
在實際測試中,ESG將華為OceanStor Pacific 9550的預(yù)估存儲成本與傳統(tǒng)的橫向擴展NAS系統(tǒng)進行了建模和比較。模型只考慮五年內(nèi)會發(fā)生的成本,而容量/性能增長需求以及IT運營成本則不在考慮之列。結(jié)果顯示,華為OceanStor Pacific的五年TCO比橫向擴展NAS系統(tǒng)低61%,其中最大的節(jié)省來自托管成本(64%),其他如資本支出(CapEx)節(jié)省62%,供電和冷卻節(jié)省32%。
“存力”也要強大
IDC的統(tǒng)計數(shù)據(jù)顯示,30%的HPC是用于數(shù)據(jù)分析,傳統(tǒng)HPC走向HPDA已是大勢所趨。大數(shù)據(jù)、人工智能、深度學(xué)習(xí)等的興起,加速了這一演進的速度。從金融、電子商務(wù)到科學(xué)計算、衛(wèi)星遙感,各類數(shù)據(jù)密集型HPC應(yīng)用對存儲提出了新的挑戰(zhàn)。僅有超強的HPC算力還不夠,必須要有同樣強大的“存力”與之相匹配。穩(wěn)定的高性能、多協(xié)議融合訪問、支持混合負(fù)載訪問、靈活的可擴展性,以及更低的TCO等,這正是HPDA存儲所擅長的,也是華為OceanStor Pacific脫穎而出的關(guān)鍵所在。
請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字