冷不丁的
看見中興通訊發了個新產品
叫做「分布式磁陣」
看到這個名字我有點迷惑
是不是Z家的市場人員搞烏龍了
磁碟陣列就磁碟陣列
分布式存儲就分布式存儲
名字拼到一塊兒算什麼鬼嘛
可是,當我把這產品拿過來
仔細地品了品
才發現其中大有玄機
不由得暗暗讚嘆
「中興,有點東西」
中興這個存儲新產品
到底都有哪些「東西」?
▼
這個問題
要從當下的兩大流派說起
一派叫做「集中派」
也就是集中式存儲或者磁碟陣列
↓
「集中派」的幫派規矩是
一個大哥率領一群小弟扛活
控制器就是大哥,俗稱機頭
擴展櫃就是小弟,俗稱JBOD
↓
集中式存儲是一種Scale UP架構
擴展存儲容量靠增加小弟數量
(主要是擴充硬碟數量)
而提升存儲性能主要提升大哥的功力
(比如增加接口數量/速率、增加緩存等等)
↓
集中式存儲的優勢是性能極高
帶頭大哥獲得了專用軟硬體加持
整個陣列在它的帶領下
提供高吞吐、高IO、低時延
一般作為主存儲,承載關鍵業務
但集中式存儲並不是萬能的
帶頭大哥功力再高也有上限
(處理器/緩存/前後端接口數量…)
一個人帶不動太多小弟
即便是多個大哥team組成集群
受限於大哥們的互聯接口
集群規模和總容量也是有限的
所以,作為傳統存儲的代表
「集中派」在性能上更能打
但論擴展性和容量,有點先天不足
尤其到了如今的數據爆炸時代
很多企業除了主存還需要第二存儲
用來存儲海量數據
這時候「集中派」就有點吃不消了
↓
同時
集中派往往高、中、低檔次分明
不同檔次組不同的池、扛不同的活
這些不同檔次的存儲池各自獨立
形成了一個個數據「煙囪」
數據的流動和融合困難重重
在這樣的背景下,另一門派悄然壯大
這就是大家熱追的「分布派」
分布式存儲講究人人平等
用不著什麼武功高深的帶頭大哥
只需要一群小弟按照分布式心法
組成按需橫向擴展的大陣
(無中心分布式架構)
↓
分布式存儲是伴隨軟體定義火起來的
所以這一派也常被稱為SDS
硬體上沒啥稀奇(插滿磁碟的伺服器)
軟體上一般都基於各種開源系統
(Ceph、Glusterfs、Lustre、Swift等)
看起來似乎門檻不高
但要把性能和穩定性搞上去
也很考驗功力
↓
因此,儘管國內分布式存儲多如牛毛
但真正能打的,還是少數幾家
而「分布派」最大的優勢,就是容量
不受大哥的限制,理論上小弟可以無限多
輕鬆拿捏幾百個PB
做到真正的「海納百川」
↓
但「分布派」也有短板
因為缺少帶頭大哥這樣的專用控制器
小弟一窩蜂幹活的整體效率還差點火候
「多副本」得盤率低,「EC」性能拉胯
利用全快閃記憶體做優化門檻高、效果差
所以,分布式存儲很難承載關鍵業務
通常被作為企業的第二存儲來使用
你以為兩派會各安其位麼?並沒有!
「集中派」心下念念著要做「大」
「分布派」耿耿於懷地要做「快」
彼此各不相讓,都想多為客戶存點寶貝
但是,因為技術路線擺在那裡
雙方都很難突破到對方禁區
那麼,到底有沒有一種存儲
既有集中式的高效率
又具備分布式的高擴展性呢
嘿嘿,那個「有點東西」的傢伙來啦
這就是中興的KS20000
分布式磁陣
↓↓↓
從這個名字的叫法
您應該就能聞出點味道來
既要「分布式」,又要「磁碟陣列」
說白了,就是魚和熊掌兼得
既能海量擴展,又具備極致的性能
又快又海量?不是做夢吧
這樣的存儲,中興究竟咋做到的?
▼
這樣的存儲,真的存在麼?
下面我們就來深度八卦一下
↓
概括講,中興這個「分布式磁陣」
架構上本質還是分布式存儲
但其中很多設計理念和處理機制
都借鑑了集中式存儲的思路
詳細來說,有這麼幾點「東西」
讓分布式磁陣整個兒立住了
↓↓↓
1、層次化集群
中興分布式磁陣並沒有採用
傳統的無中心分布式架構
而是把集群分層設計
管理集群+業務集群
↓
這個思路就借鑑了「集中派」
管理集群有點像控制器角色
但它只負責「管理職能」
業務流量接口還是在業務集群
不像傳統控制器「又當爹又當媽」
結果成了整個陣列的性能天花板
↓
跟通用的分布式存儲方案相比
分層設計讓管理集群有了更高的視角
業務集群單層組網,多集群集中管理
業務集群間進行有效的安全、流量、性能隔離
根據需求也可以讓數據融合和流動
而大部分傳統分布式架構缺乏層次化
管理節點、監控節點、數據節點同一平面
↓
因此,從架構設計上
分布式磁陣汲取了兩大陣營的長處
小業務集群組網簡單,存儲高效
大管理集群海量擴容,消滅數據煙囪
2、後端共享高效訪問
在分布式磁陣的業務集群內
不同節點的磁碟共享訪問
跨節點協作極其簡單
節點間基於RDMA高效轉發
可達到接近訪問本地磁碟的體驗
另外,基於多核處理架構
並發能力大大提高
處理對象可以靈活綁定到核、動態遷移
提供多種均衡策略(容量/負載等)
3、獨特塊級映射表
這部分是提高存儲效率的關鍵
也是分布式存儲長期以來的短板
中興分布式磁陣採用了
類似集中式存儲的塊級映射表
↓
業內通用的分布式存儲方案,比如Ceph
本質上還是依賴於RADOS
尋址要經過三次映射
File → ①Object → ②PG → ③OSD
而分布式磁陣的映射表是塊到塊直接映射
效率和靈活性都高了好幾個Level
這種獨特映射表設計
便於更靈活的數據分布和均衡策略
自動分級和動態QoS也大大簡化
更為實現高性能EC打下了基礎
4、高效EC和高效緩存
獨特映射表設計再配合軟體優化
可以實現高效靈活糾刪碼(EC)機制
(追加寫、滿條寫、介質適配、均衡策略)
消除寫放大、寫懲罰,匹配Flash擦寫塊
數據分布更靈活、更均衡
相同可用容量情況下
EC性能可與多副本持平,物理盤省一半
相同物理容量情況下
EC性能高於多副本,得盤率高一倍
甚至,相同盤數配置下
性能比盤陣RAID5/RAID6還強
同時,通過多級緩存靈活調度
實現數據智能分層和讀寫加速
而且,緩存檔與數據盤沒有綁定關係
效率更高,維護更方便
↓
總之,中興這套分布式磁陣
還有不少「東西」值得拎出來說
比如高性能ROW快照、無限快照克隆樹
能給予備份策略更多的自由度
再比如負載均衡&空間均衡分別控制
非常有利於大型存儲資源池的管理
中興這個分布式磁陣
實戰起來也是相當有「東西」!
▼
中興分布式磁陣的具體型號
叫做KS20000
包含三大類型節點
(性能型、容量性、均衡性)
↓
三類節點可以靈活搭配
結合層次化的集群設置
構建統一的多用途存儲資源池
一套系統覆蓋數據從熱倒冷全生命周期
(核心生產→研發測試→備份歸檔)
這樣,數據可以按需流動
不會再變成一個個「煙囪」
以前企業為了支撐不同類型的業務
往往需要部署不同檔次的異構存儲
如今,採用KS20000一站式搞定
部署方便,統一管理,靈活擴展
我們再來總結下
KS20000作為融合兩大陣營優勢的產品
可以完全替代全閃或混閃陣列
同等配置性能持平甚至更優
同時又具備海量橫向擴展能力
講真,確實有點兒東西!