某客戶使用的是HP gen8機(jī)器,用的是p420i陣列卡,同時在系統(tǒng)的另一端,nagios監(jiān)控系統(tǒng)配合nrpe腳本check_hpasm定期檢測硬件健康。
最近為了讓機(jī)器更帶勁,加上了SSD硬盤,機(jī)械硬盤僅用作大容量存儲,在感受速度與激情的同時,悲劇接踵而至。
nagios 監(jiān)控報(bào)警,硬件出錯:
由于報(bào)警內(nèi)容非常含糊,像是一顆***,根本不敢將機(jī)器正式投入運(yùn)營,不得不將機(jī)器從機(jī)房運(yùn)回來仔細(xì)測試。感覺是硬件故障,但是替換了陣列卡甚至重裝了N次操作系統(tǒng)之后,依然報(bào)相同的錯誤。如果不用SSD,只使用普通硬盤,就不會報(bào)錯。
最終的問題定位到了HP 陣列卡里的HP SSD smart path 功能,該功能可以加速SSD盤讀寫,有點(diǎn)混合硬盤的味道,即當(dāng)作機(jī)械硬盤的緩存。但是很抱歉,如果你使用SSD硬盤安裝操作系統(tǒng)的話,會有上面的報(bào)錯。
解決辦法:
hpssacli-2.0-22.0.x86_64.rpm ,經(jīng)過測試,這個包c(diǎn)entos 6/7 都適用。
也可以開機(jī)根據(jù)提示按F5進(jìn)入陣列卡的圖形管理界面來禁用該功能。