【資料圖】
堅持面向世界科技前沿,不斷向科學(xué)技術(shù)廣度和深度進發(fā)是科技工作者的初心和使命。工欲善其事,必先利其器,西湖大學(xué)聯(lián)手浪潮信息等科技企業(yè)建設(shè)領(lǐng)先的創(chuàng)新平臺與實驗室,為前沿科技研究構(gòu)建數(shù)據(jù)基座,創(chuàng)造影響世界、造福人類的科學(xué)知識和技術(shù)。
高起點的創(chuàng)新研究有高要求
西湖大學(xué)工學(xué)院目前重點建設(shè)包括人工智能與數(shù)據(jù)科學(xué)、生物醫(yī)學(xué)工程、化學(xué)與生物工程、電子信息科學(xué)與技術(shù)、材料科學(xué)與機械工程、可持續(xù)發(fā)展與環(huán)境工程在內(nèi)的六大研究領(lǐng)域。圍繞研究領(lǐng)域,工學(xué)院已建成一批高水平實驗室和研究中心,其中已獲批成立浙江省3D微納加工和表征研究重點實驗室,建立微納光電系統(tǒng)集成浙江省工程研究中心。在這些研究中,科研數(shù)據(jù)無疑是科學(xué)家們不可替代的資產(chǎn);因此,西湖大學(xué)工學(xué)院對科研項目數(shù)據(jù)基礎(chǔ)設(shè)施要求苛刻,要能夠在承載目前現(xiàn)有眾多科研項目的同時,滿足未來學(xué)校及科學(xué)家們的研究方向和規(guī)模發(fā)展的需求。
西湖大學(xué)合成生物學(xué)與生物智造中心聚焦于新一代生物藥物、生物材料以及基于二氧化碳和太陽能的大規(guī)模綠色生物制造核心技術(shù);人工智能與數(shù)據(jù)科學(xué)方向的科學(xué)家們在自然語言處理、計算機視覺、深度學(xué)習(xí)等領(lǐng)域深度探索,致力于攻堅人類科學(xué)難題;分子科學(xué)公共實驗平臺服務(wù)功能分子合成、綠色催化、能源材料、環(huán)境生態(tài)及化學(xué)生物等科研創(chuàng)新方向。這些科研平臺的數(shù)據(jù)包含了圖片、視頻、文本等大量非結(jié)構(gòu)化數(shù)據(jù),而大量不同類型的數(shù)據(jù)訪問存儲時的IO特征各不相同,這就要求存儲平臺提供混合IO負(fù)載的承接能力,各大實驗室每天有很多科研工作者在進行項目的研究,這也要求存儲能夠高效支撐海量文件的并發(fā)處理。
西湖大學(xué)工學(xué)院研究交叉學(xué)科與新興學(xué)科新興產(chǎn)業(yè)領(lǐng)域,專注尖端的研究內(nèi)容,如生物工程、生態(tài)環(huán)境、碳中和、技術(shù)、新材料、微電子等科研項目,科研實驗的數(shù)據(jù)采集具有周期長、采集復(fù)雜、環(huán)境要求較高,甚至一些數(shù)據(jù)(比如氣候數(shù)據(jù))是不可再生的,此外科研項目涉及的研究員來自多個世界頂級學(xué)府,包括清華大學(xué)、北京大學(xué)、麻省理工、加利福尼亞大學(xué)等;為了穩(wěn)固地按照時間節(jié)點推進科研項目,采集分析實驗數(shù)據(jù),數(shù)據(jù)安全可靠必須得到保障。
浪潮分布式存儲支撐前沿研究
正是因為聚焦基礎(chǔ)前沿科學(xué)研究,致力尖端科技突破,注重學(xué)科交叉融合,努力實現(xiàn)原始創(chuàng)新和科技成果轉(zhuǎn)化的重大突破,為了保障尖端研究課題的順利、高效開展,西湖大學(xué)工學(xué)院采用了浪潮分布式存儲AS13000、AI服務(wù)器等產(chǎn)品及解決方案,為科研平臺提供了計算及數(shù)據(jù)基礎(chǔ)設(shè)施支撐。浪潮分布式存儲AS13000可提供文件、對象、塊、大數(shù)據(jù)等多種存儲服務(wù),通過靈活的存儲協(xié)議選擇以及多種存儲協(xié)議之間的互通性滿足多領(lǐng)域科研項目課題的負(fù)載多樣性。
西湖大學(xué)工學(xué)院的科研平臺的集群采用了全對稱分布式融合架構(gòu),節(jié)點間通過100G InfiniBand高速互聯(lián)網(wǎng)絡(luò)聯(lián)通集群節(jié)點間數(shù)據(jù)交互,在科研應(yīng)用向存儲系統(tǒng)提交讀寫請求后,所有分布式節(jié)點參與并發(fā)讀寫,基于聚合的小文件優(yōu)化技術(shù),減少了數(shù)據(jù)寫入硬盤次數(shù),提高小文件讀寫性能,保證科研項目在任何節(jié)點都能有流暢的數(shù)據(jù)讀寫。
同時為了保證數(shù)據(jù)安全性,西湖大學(xué)配置副本功能,所有科研數(shù)據(jù)都有兩份相同的數(shù)據(jù)分布于全部分布式存儲節(jié)點上,當(dāng)某節(jié)點出現(xiàn)故障時,可以自動切換到備用節(jié)點上,確保科研平臺數(shù)據(jù)不會丟失,保證了數(shù)據(jù)安全性,設(shè)備類故障頻率降低,保障項目課題的持續(xù)運行。