了解在使用 IBM DB2 時如何識別最常見的損壞問題,并對這些問題進行分類。在本文中,將了解一些糾正和預防技術,您可以用它們來解決討厭的損壞問題。
被視為是最麻煩的業(yè)務問題之一,損壞常常在不知不覺中逐漸形成,給企業(yè)帶來不利影響。簡言之,可以將損壞 定義為中的任何意外項。損壞問題可能會對系統(tǒng)造成嚴重的性能沖擊。在某些情況下,它可能會導致頻繁的系統(tǒng)崩潰,引發(fā)關鍵業(yè)務系統(tǒng)宕機。數(shù)據(jù)庫損壞可發(fā)生在任何層面,從 DB2 到操作系統(tǒng)以及硬件層。因此,了解和排除故障很重要,即分析所有可能受影響的層,并收集可能盡快需要的任何可用的診斷數(shù)據(jù)。
在本文中,您將了解為何數(shù)據(jù)庫會在遇到損壞問題時離線。您還將學習分析損壞癥狀,區(qū)分易于修復的故障和災難性故障。本文將闡明使用 IBM DB2 時的損壞問題,并幫助 DB2 用戶理解和選擇處理這種關鍵的高影響問題的最佳方法。
本文首先討論可能的損壞來源,然后解釋以下任務:
來源
數(shù)據(jù)庫損壞可能在寫入、讀取、存儲、傳輸或處理過程中發(fā)生,這會向原始數(shù)據(jù)引入非計劃中的更改。損壞問題的一些常見原因:
雖說損壞問題由各種原因而致,確切地查明是什么導致了數(shù)據(jù)損壞是極具挑戰(zhàn)的。在大部分情況下,該問題是由文件系統(tǒng)問題和硬件問題引起的。
識別和排除故障
對于一個 DBMS,頁面 是由操作系統(tǒng)為一個程序執(zhí)行的內(nèi)存分配的數(shù)據(jù)的最小單元,在主內(nèi)存與任何其他輔助存儲(比如硬盤驅動器)之間傳輸。因此所謂數(shù)據(jù)庫損壞也就是說數(shù)據(jù)庫中的某些頁面被損壞了。
如果 DB2 有無法得體處理的錯誤情況,panic 是它會用來招致崩潰的一種方法。當 DB2 檢測到一個頁面損壞時,它通過一個受控崩潰 (panic) 停止所有處理,因為它無法確定數(shù)據(jù)庫完整性。這也是為了阻止進一步的數(shù)據(jù)損害或丟失。
當 DB2 遇到數(shù)據(jù)庫損壞時,db2diag.log 中轉儲很多錯誤消息。當出現(xiàn)意外中斷且啟用了自動的首次出現(xiàn)數(shù)據(jù)捕獲 (FODC) 時,會基于癥狀來收集數(shù)據(jù)。當滿足以下條件之一時,DB2 9.5 上會自動收集 FODC 數(shù)據(jù):
要搜集必要的信息,比如 OS 診斷(例如,AIX® 上的 errpt –a、snap 和 fileplace 輸出)以及任何硬件診斷(狀態(tài)保存和錯誤日志等),關鍵是要包含 OS 和硬件支持。重要的是要確保關鍵的文件系統(tǒng)有足夠的磁盤空間,比如轉儲空間和日志目錄,從而確保完全捕獲關鍵事件。
您可以查看 db2diag.log,確認 panic 是因為損壞還是另外的原因引起的。下面您會看到如何識別 DB2 中的損壞并對其進行分類。以下是識別損壞的最常見的一些 db2diag.log 錯誤消息。
聲明:本網(wǎng)頁內(nèi)容旨在傳播知識,若有侵權等問題請及時與本網(wǎng)聯(lián)系,我們將在第一時間刪除處理。TEL:177 7030 7066 E-MAIL:11247931@qq.com