數(shù)字經(jīng)濟(jì)時(shí)代,云計(jì)算、大數(shù)據(jù)、人工智能等新技術(shù)快速發(fā)展,非結(jié)構(gòu)化數(shù)據(jù)爆發(fā)式增長(zhǎng),數(shù)據(jù)類型變得愈發(fā)復(fù)雜多樣。在自動(dòng)駕駛、基因測(cè)序、氣象預(yù)報(bào)等云數(shù)智應(yīng)用場(chǎng)景中,一次數(shù)據(jù)處理可能會(huì)涉及文件、對(duì)象、大數(shù)據(jù)等多種協(xié)議,數(shù)據(jù)間的互通轉(zhuǎn)換成為數(shù)據(jù)存儲(chǔ)中至關(guān)重要的一環(huán),具備平臺(tái)化能力的融合存儲(chǔ)成為數(shù)字基礎(chǔ)設(shè)施建設(shè)的核心。
以基因測(cè)序場(chǎng)景為例,一次完整的基因測(cè)序涉及到數(shù)據(jù)采集、格式化、脫敏、壓縮、分析、發(fā)布等操作,其過程可以大致分為樣本采集、DNA/RNA測(cè)序、數(shù)據(jù)分析和發(fā)布四個(gè)步驟。在不同的處理階段,需要使用不同的數(shù)據(jù)協(xié)議進(jìn)行操作。其中在樣本采集和DNA/RNA測(cè)序階段采用NFS文件協(xié)議,數(shù)據(jù)分析階段采用HDFS大數(shù)據(jù)協(xié)議,數(shù)據(jù)發(fā)布階段則是通過公網(wǎng)數(shù)據(jù)共享采用S3對(duì)象協(xié)議。整個(gè)數(shù)據(jù)處理過程涉及三種協(xié)議格式,這就意味著完成一次基因的測(cè)序流程需要在NFS、HDFS和S3之間進(jìn)行兩次數(shù)據(jù)拷貝和數(shù)據(jù)格式的轉(zhuǎn)換。傳統(tǒng)存儲(chǔ)僅支持單一的訪問協(xié)議,這就會(huì)造成兩個(gè)問題:一是數(shù)據(jù)格式轉(zhuǎn)換和數(shù)據(jù)拷貝會(huì)降低整個(gè)數(shù)據(jù)處理流程的效率;二是多套存儲(chǔ)副本增加存儲(chǔ)空間成本。
基因測(cè)序應(yīng)用需要使用多種數(shù)據(jù)協(xié)議
(資料圖片僅供參考)
浪潮分布式存儲(chǔ)平臺(tái)AS13000基于對(duì)非結(jié)構(gòu)化數(shù)據(jù)協(xié)議(NFS/CIFS/HDFS/S3)融合互通的研究進(jìn)行技術(shù)創(chuàng)新,采用統(tǒng)一的數(shù)據(jù)管理和元數(shù)據(jù)管理、統(tǒng)一的增值特性服務(wù)、統(tǒng)一的分布式存儲(chǔ)資源池和統(tǒng)一的管理軟件系統(tǒng),保證各種協(xié)議共享同一份數(shù)據(jù)和元數(shù)據(jù)。訪問過程中無(wú)需數(shù)據(jù)轉(zhuǎn)換和拷貝,并且為每種協(xié)議提供原生語(yǔ)義服務(wù),每種服務(wù)均可直接訪問,無(wú)需安裝網(wǎng)關(guān)、插件或在計(jì)算側(cè)或應(yīng)用層進(jìn)行改造。
AS13000非結(jié)構(gòu)化數(shù)據(jù)融合架構(gòu)
基于“多合一”極簡(jiǎn)架構(gòu),浪潮分布式存儲(chǔ)得以實(shí)現(xiàn)四個(gè)“統(tǒng)一”。
首先,提供統(tǒng)一的數(shù)據(jù)管理和元數(shù)據(jù)管理。
數(shù)據(jù)管理和元數(shù)據(jù)管理是非結(jié)構(gòu)化數(shù)據(jù)存儲(chǔ)的關(guān)鍵,浪潮分布式存儲(chǔ)平臺(tái)AS13000根據(jù)NFS、CIFS、HDFS和S3的語(yǔ)義和元數(shù)據(jù)特點(diǎn),抽象各協(xié)議的數(shù)據(jù)和元數(shù)據(jù)操作,通過一套統(tǒng)一的非結(jié)構(gòu)化數(shù)據(jù)和元數(shù)據(jù)管理架構(gòu)有效地保證各協(xié)議的原生訪問。
其次,提供統(tǒng)一的增值特性服務(wù)。
基于統(tǒng)一的數(shù)據(jù)訪問接口和元數(shù)據(jù)管理的架構(gòu)設(shè)計(jì),浪潮AS13000對(duì)外提供統(tǒng)一的增值特性服務(wù),包括統(tǒng)一配額、QoS、加密、壓縮、快照、回收站、分級(jí)存儲(chǔ)、遠(yuǎn)程復(fù)制、元數(shù)據(jù)檢索等等。
以下圖為例:同一個(gè)元數(shù)據(jù)檢索服務(wù)ElasticSearch支持NFS、CIFS、S3、HDFS多種協(xié)議,并且各協(xié)議為同一配置入口和查詢?nèi)肟凇?/p>
統(tǒng)一增值特性示例:元數(shù)據(jù)檢索服務(wù)
再次,構(gòu)建統(tǒng)一的分布式存儲(chǔ)資源池。
AS13000支持NFS/CIFS/HDFS/S3等多種服務(wù)協(xié)議共享非結(jié)構(gòu)化存儲(chǔ)資源池,并且同一個(gè)文件不同協(xié)議訪問的數(shù)據(jù)和元數(shù)據(jù)為同一份。例如,通過文件NFS協(xié)議寫入的一個(gè)文件,通過對(duì)象存儲(chǔ)AWS S3協(xié)議、大數(shù)據(jù)HDFS協(xié)議和文件CIFS協(xié)議均可讀??;每個(gè)節(jié)點(diǎn)都可以啟動(dòng)文件NAS、大數(shù)據(jù)HDFS和對(duì)象存儲(chǔ)S3服務(wù)。
最后,打造統(tǒng)一的管理系統(tǒng)。
管理軟件負(fù)責(zé)集群的安裝、部署、業(yè)務(wù)配置、設(shè)備管理、監(jiān)控、告警等功能。浪潮分布式存儲(chǔ)平臺(tái)AS13000打造了融合互通的管理系統(tǒng),可同時(shí)支持NFS/CIFS/HDFS/S3等多種服務(wù)協(xié)議,增值特性通過統(tǒng)一的配置入口對(duì)所有非結(jié)構(gòu)化存儲(chǔ)協(xié)議同時(shí)生效,減少了企業(yè)的管理成本。
浪潮分布式存儲(chǔ)平臺(tái)AS13000通過多年來的持續(xù)技術(shù)創(chuàng)新,以一份數(shù)據(jù)支持多種協(xié)議訪問,實(shí)現(xiàn)了非結(jié)構(gòu)化數(shù)據(jù)融合互通,在提升數(shù)據(jù)處理效率的同時(shí)降低了存儲(chǔ)購(gòu)置和運(yùn)維成本,保障各協(xié)議的語(yǔ)義無(wú)損和性能無(wú)損,構(gòu)筑了面向“云數(shù)智”應(yīng)用的融合存儲(chǔ)平臺(tái),助力企業(yè)數(shù)字化轉(zhuǎn)型,加速釋放數(shù)據(jù)價(jià)值。