恢復已停機超過15天的儲存節點
如果單一儲存節點已離線、且超過15天未連線至其他儲存節點、則必須在節點上重新建置Cassandra。
-
您已檢查儲存節點汰換是否在進行中、或您已暫停節點取消委任程序。(在Grid Manager中、選取*維護*維護工作*取消配置。)
-
您已檢查擴充是否在進行中。(在Grid Manager中、選取*維護*維護工作*擴充。)
儲存節點具有Cassandra資料庫、其中包含物件中繼資料。如果儲存節點無法與其他儲存節點通訊超過15天、StorageGRID 則會假設節點的Cassandra資料庫已過時。在使用其他儲存節點的資訊重建Cassandra之前、儲存節點無法重新加入網格。
只有在單一儲存節點當機時、才能使用此程序來重新建置Cassandra。如果額外的儲存節點離線、或是在過去15天內在另一個儲存節點上重建Cassandra、請聯絡技術支援部門;例如、Cassandra可能已重新建置為恢復故障儲存磁碟區或恢復故障儲存節點的程序之一。
如果有多個儲存節點故障(或離線)、請聯絡技術支援部門。請勿執行下列恢復程序。資料可能會遺失。 |
如果這是儲存節點故障或恢復後15天內的第二個儲存節點故障、請聯絡技術支援部門。請勿執行下列恢復程序。資料可能會遺失。 |
如果站台上的多個儲存節點發生故障、可能需要執行站台還原程序。聯絡技術支援。 |
-
必要時、開啟需要恢復的儲存節點。
-
登入網格節點:
-
輸入下列命令:
ssh admin@grid_node_IP
-
輸入中所列的密碼
Passwords.txt
檔案: -
輸入下列命令以切換至root:
su -
-
輸入中所列的密碼
Passwords.txt
檔案:
當您以root登入時、提示會從變更
$
至#
.+ -
如果您無法登入網格節點、系統磁碟可能不完整。請移至從系統磁碟機故障中恢復的程序。 "從系統磁碟機故障中恢復" |
-
在儲存節點上執行下列檢查:
-
發出此命令:
nodetool status
輸出應為
Connection refused
-
在Grid Manager中、選取* Support ** Tools * Grid topology *。
-
選擇_sSite * Storage Nod* SDV Services*(站點_*儲存節點*)。確認Cassandra服務已顯示
Not Running
。 -
選擇*儲存節點* S50*資源。確認「Volumes(磁碟區)」區段中沒有錯誤狀態。
-
發出此命令:
grep -i Cassandra /var/local/log/servermanager.log
您應該會在輸出中看到下列訊息:
Cassandra not started because it has been offline for more than 15 day grace period - rebuild Cassandra
-
-
發出此命令、並監控指令碼輸出:
check-cassandra-rebuild
-
如果儲存服務正在執行、系統會提示您停止這些服務。輸入:* y*
-
檢閱指令碼中的警告。如果不適用、請確認您要重新建置Cassandra。輸入:* y*
部分StorageGRID 還原程序會使用Reaper來處理Cassandra的修復作業。一旦相關或必要的服務開始、系統就會自動進行修復。您可能會注意到指令碼輸出中提到「Shaper」或「Cassandra repair」。 如果您看到指出修復失敗的錯誤訊息、請執行錯誤訊息中指示的命令。
-
-
重建完成後、請執行下列檢查:
-
在Grid Manager中、選取* Support ** Tools * Grid topology *。
-
選擇_site 恢復儲存節點* Sover服務*。
-
確認所有服務都在執行中。
-
選擇* DDS * Data Stor編。
-
確認*資料儲存區狀態*為「up」、*資料儲存區狀態*為「正常」。
-