雲南天文台:基於分布式存儲 為天文觀測構建新數據底座

光明網 發佈 2024-05-07T07:39:27.324250+00:00

晴空萬里、群星璀璨的麗江高美古,在納西語中的釋義是「天氣好、星星多、離天最近的地方」。這裡的年平均晴天超200天,大氣潔淨透明,抬頭可見滿天的繁星、清晰的銀河,近年來逐步成為國內重要的天文觀測站點,逐步成為國內外天文工作者的觀測聖地。

晴空萬里、群星璀璨的麗江高美古,在納西語中的釋義是「天氣好、星星多、離天最近的地方」。這裡的年平均晴天超200天,大氣潔淨透明,抬頭可見滿天的繁星、清晰的銀河,近年來逐步成為國內重要的天文觀測站點,逐步成為國內外天文工作者的觀測聖地。建設在高美古的中國科學院雲南天文台麗江觀測站(以下簡稱麗江觀測站),擁有獨特的地理環境優勢,經過多年的建設,逐步建設完成了2.4米、1.8米、1.6米等多種口徑規格光學望遠鏡和一批小口徑的遠程/自動望遠鏡、日冕儀、射電望遠鏡等科學觀測裝置,雲南天文台的南方天文觀測集群已經初具規模。

隨著天文觀測需求的不斷提升,天文觀測所產生的觀測數據量也越來越大,這也對數據存儲和處理提出了更高的要求。為此,麗江觀測站採用浪潮分布式存儲構建三級數據存儲平台,為天文研究乃至今後的數字經濟產業研究提供有利的硬體平台支撐。

雲南天文台麗江觀測站的2.4米光學望遠鏡

天文觀測儀器背後驚人的數據需求

麗江觀測站擁有多種型號的天文望遠鏡,包括光學望遠鏡、日冕儀和射電望遠鏡,整個觀測站的觀測能力已經覆蓋了從光學到射電的波段範圍,每年能開展多項具有國際先進水平的天體物理觀測和研究工作。

近些年隨著新的天文觀測技術快速發展,觀測的廣度和精度得到極大提升,讓天文工作者更清晰地觀測到天文目標,也更準確地驗證已有物理模型。與此同時,新的天文觀測儀器採集的數據量也有了量級的提升,如麗江觀測站正在調試的雲南大學1.6米多通道測光巡天望遠鏡,其中裝置了3台大靶面的科學技術CCD相機,每個相機由4片9k*9k的晶片拼接而成,在觀測過程中三台相機同時曝光,一次曝光就能產生近1GB的觀測數據,一個觀測夜的觀測數據量近3TB,一年的原始觀測數據接近1PB。如何有效的傳輸觀測站眾多望遠鏡觀測採集的數據、支撐計算平台高效地分析和處理觀測數據、安全存儲原始數據和價值數據,給麗江天文觀測站的觀測數據管理提出了新的需求。

一是數據性能需求。在數據採集過程中,天文望遠鏡觀測產生的數據,需要通過數據採集程序,實時地完成數據採集、數據預處理、計算、數據存檔等多個任務。在數據計算過程中,作為以數據為驅動的天文觀測任務,科研計算平台需要存儲集群平台提供數十GB/s聚合帶寬的讀寫能力以保證計算任務並行的高效性。二是數據的長期保存需求。天文觀測的原始數據要通過合理的生命周期管理系統進行永久歸檔保留,數據的自動化遷移歸檔、數據的安全性、歸檔數據長期保存成本、存儲的易擴展性是數據歸檔存儲考慮的重要因素。

分層存儲方案滿足不同天文數據的需求

麗江觀測站為了滿足天文科研工作者對望遠鏡觀測數據的存儲和分析處理過程中高帶寬存儲資源需求,採用了浪潮的計算節點和分布式存儲搭建了三級分層的存儲資源池,通過浪潮分布式存儲高性能節點AS13000G5-H搭建高速存儲層提供並行讀寫能力,滿足前端多個計算節點同時在存儲上進行數據讀寫的需求;採用浪潮分布式存儲AS13000G5-M系列4U60高密節點提供2PB低速存儲空間,用於存儲前端回傳的觀測原始數據以及計算集群計算處理後的歸檔數據。

為天文觀測任務提供性能保障

浪潮AS13000G5-H通過私有客戶端,能夠使接收到的數據並發寫入每個數據節點,打破傳統存儲的單存儲節點性能限制,通過RDMA協議,有效降低數據傳輸過程中的時延,進一步提升傳輸效率,單存儲節點性能可達到GB/s讀寫帶寬。通過並行文件系統可以添加更多的存儲節點,性能和容量隨節點數的增加而線性增長。

科研項目的階段性增長可以按需滿足、高效運維

為保障天文數據長期可靠保存、彈性擴展的需求,浪潮存儲在架構和運維方面進行了創新。

擴展性方面,浪潮存儲基於分布式存儲架構支持靈活擴展,可隨著天文科研項目需求橫向擴展,運用獨特的擴容算法,在擴容同時可保障業務性能無明顯波動,性能與容量隨著節點的擴展而線性增長,避免對現有接收業務和科研計算任務讀寫訪問性能造成影響,滿足了未來天文觀測儀器設備提升的存儲增長需求。

在可靠性方面,浪潮分布式存儲採用糾刪策略,允許多個節點損壞時業務不中斷,保證觀測任務以及計算任務7x24小時的連續業務訪問,保障天文工作者科研項目順利進行。同時還可搭配InView智能管理平台,對於天文觀測海量數據中心的設備進行管理,提供容量、性能、故障等預測性分析等一系列智能化功能,幫助運維人員預防硬體潛在故障,同時降低存儲的複雜性和維護成本。

占地260餘畝麗江觀測站園區里運行的光學望遠鏡每年都要執行數千次的觀測任務,積累大量的原始觀測數據,這些觀測數據幫助科研工作者取得了大量研究成果,加速中國天文研究的發展。如藉助2.4米望遠鏡光譜觀測發現了數十個高紅移類星體;通過系外行星的精確視向速度搜尋工作,已經發現若干顆系外行星候選源;擅長搜尋新的凌食系外行星系統的寬視場巡天望遠鏡(小口徑望遠鏡),幫助科學家們發現了10多顆凌食系外行星候選體以及200多顆其它類型的變源。

未來雲南天文台麗江觀測站也將在此基礎上,不斷進行天文學高新技術創新,為天文學的科學應用研究服務提供高質量的觀測數據,發揮南方天文觀測集群的前沿作用,推動天文領域研究的快速發展,探索宇宙奧秘。(馬嘉悅)

來源: 人民政協網

關鍵字: