數(shù)據(jù)中心內(nèi)的可靠性保障技術(shù)主要包括HA(High Availability)冷備份、FT(Fault Tolerance)熱備、輕量級FT。
HA(High Availability)冷備份:數(shù)據(jù)中心內(nèi)基于共享存儲的冷遷移,在由于軟件或硬件原因引發(fā)主用VM/PM故障的情況下,觸發(fā)應(yīng)用在備用服務(wù)器上啟動;適用于不要求業(yè)務(wù)零中斷,或無狀態(tài)應(yīng)用的可靠性保障(見圖2-13)。
圖2-13 冷備份原理
FT(Fault Tolerance)熱備:指令、內(nèi)存、所有狀態(tài)數(shù)據(jù)同步。該方式的優(yōu)勢是狀態(tài)完全同步,完全保證一致性;支持SMP。劣勢是性能開銷大,會帶來40%左右的性能降低(見圖2-14)。
圖2-14 熱備份原理
輕量級FT:基于I/O同步的FT熱備機制。優(yōu)勢:CPU/網(wǎng)絡(luò)性能損耗10%以內(nèi),支持單核和多核。劣勢是適合于網(wǎng)絡(luò)I/O為主服務(wù)的場景(見圖2-15)。
圖2-15 輕量級FT原理
跨數(shù)據(jù)中心的可靠性保障技術(shù),主要是基于存儲虛擬化層I/O復(fù)制的同步和異步容災(zāi)兩種。
基于存儲虛擬化層I/O復(fù)制的同步容災(zāi),采用生產(chǎn)和容災(zāi)中心同城(<100KM)部署,時延小于5ms,DC間帶寬充裕,并且對RPO(恢復(fù)點目標)要求較高,一般RPO接近或者等于0秒。分布式塊存儲提供更高效的I/O同步復(fù)制效率(見圖2-16)。
圖2-16 基于應(yīng)用層的容災(zāi)復(fù)制原理
基于存儲虛擬化層I/O復(fù)制的異步容災(zāi)采用生產(chǎn)和容災(zāi)中心異地(>100KM)部署,帶寬受限,時延>5ms,同時對RPO有一定容忍度,如RPO>5分鐘。I/O復(fù)制及快照對性能的影響趨近于零(見圖2-17)。
圖2-17 基于存儲層的容災(zāi)復(fù)制原理