上回文章中說道2005年第一個(gè)工作日熬了個(gè)通宵,具體講來是到廈門和Beta一起實(shí)施oracle rac安裝。雖然已經(jīng)拿到證書,但因?yàn)楣ぷ餍再|(zhì)關(guān)系,數(shù)據(jù)庫維護(hù)還是做得不多,這次讓我好好重溫oracle知識。 Beta比較熱誠,已經(jīng)在客戶那里奮戰(zhàn)兩天兩夜,幾近油枯燈盡(
上回文章中說道2005年第一個(gè)工作日熬了個(gè)通宵,具體講來是到廈門和Beta一起實(shí)施oracle rac安裝。雖然已經(jīng)拿到證書,但因?yàn)楣ぷ餍再|(zhì)關(guān)系,數(shù)據(jù)庫維護(hù)還是做得不多,這次讓我好好重溫oracle知識。
Beta比較熱誠,已經(jīng)在客戶那里奮戰(zhàn)兩天兩夜,幾近油枯燈盡(年輕人要注意保重身體?。?,我到廈門也就是參加掃尾。
總的說來,全過程碰到的問題不少,但任務(wù)比較緊急,一些細(xì)節(jié)來不及考證,回來后在辦公室環(huán)境中搭一個(gè)環(huán)境繼續(xù)研究,另外試驗(yàn)環(huán)境還可供其它同事參考。
本系列文章全程記錄安裝過程中碰到的所有問題和解決手段。
1.準(zhǔn)備環(huán)境
2.準(zhǔn)備環(huán)境(續(xù))
3.HACMP安裝配置
4.OracleRac安裝前準(zhǔn)備
5.安裝oracle軟件
6.Oracle建庫
7.RAC使用和測試
<下一篇>
一、準(zhǔn)備環(huán)境。搭設(shè)的硬件環(huán)境如下:
44p270主機(jī)一臺:375MHz PowerPC_POWER3 CPU一顆、512 MB內(nèi)存、18.2GB內(nèi)置硬盤、主板內(nèi)置網(wǎng)卡+2968以太網(wǎng)卡、6230 SSA卡;
f80主機(jī)一臺:450MHz PowerPC RS64III CPU四顆、2048MB內(nèi)存、36.4GB內(nèi)置硬盤、主板內(nèi)置網(wǎng)卡+2968以太網(wǎng)卡、6230 SSA卡;
7133-D40磁盤陣列:2塊36.4B 1萬轉(zhuǎn)硬盤構(gòu)成RAID1陣列。
最后的軟件環(huán)境如下:
AIX 5L V5.2、ML04+IY64978+IY63366
HACMP V5.1+U498114
f80主機(jī)剛剛在廈門光榮退租,要重新安裝操作系統(tǒng)。安裝過程中發(fā)現(xiàn)一個(gè)奇怪的問題,很多執(zhí)行文件的存取屬性被清空(變成----------)而導(dǎo)致無權(quán)限執(zhí)行,這首先嚴(yán)重影響了打ML04補(bǔ)丁,bos.rte補(bǔ)丁中的一個(gè)script總是運(yùn)行不成功,報(bào)/usr/lib/methods/cfgsf命令執(zhí)行失?。╞os.rte.config_u[42]: /usr/lib/methods/cfgsf: 0403-006 Execute permission denied.
update: Failed while executing the bos.rte.config_u script.),結(jié)果bos.rte及依賴其的幾個(gè)文件集補(bǔ)丁無法實(shí)施。因?yàn)閏fgsf文件本身就屬于bos.rte,installp在安裝bos.rte的時(shí)候先把它的存取屬性清除了(覆蓋原文件),然后再執(zhí)行它,所以在installp之前修改cfgsf的屬性沒有意義。
解決方法比較笨拙,寫一個(gè)死循環(huán)shell程序,不斷地執(zhí)行chmod 500 /usr/lib/methods/cfgsf命令(見下)。
while true
do
chmod 500 /usr/lib/methods/cfgsf
done
方過此關(guān)。
存取屬性被清空的執(zhí)行文件還有很多,引發(fā)了相當(dāng)多的類似問題,其中一個(gè)就是影響了包括ssa卡和硬盤在內(nèi)的很多設(shè)備的識別配置,/usr/lib/methods/下的文件都要檢查一下。還有/usr/ssa下的幾個(gè)bin目錄也要重新設(shè)置一下執(zhí)行屬性。
因?yàn)樵诰W(wǎng)上找不到類似的解決案例,我懷疑是手上的安裝光盤有問題。
繼續(xù)軟硬件環(huán)境的準(zhǔn)備。
1.2.網(wǎng)卡問題270主機(jī)上的一塊網(wǎng)卡,訪問網(wǎng)絡(luò)總是有問題,ping不通。換過網(wǎng)線、插槽都不行,但把卡插到另一臺b50主機(jī)上,網(wǎng)絡(luò)訪問又正常,懷疑是270主機(jī)主板問題,執(zhí)行diag診斷(要先ifconfig en1 detach,否則報(bào)設(shè)備忙,無法進(jìn)一步診斷),報(bào)下面錯(cuò)誤:
SRN: 777-104
Description: Internal Loopback Test Failed.
Probable FRUs:
ent1 FRU: 091H0397 P2-I4/E1
IBM 10/100 Mbps Ethernet PCI Adapter (23100020)
看來還是網(wǎng)卡有問題,回到b50主機(jī)再做diag診斷,也報(bào)類似錯(cuò)誤,正式宣告該卡死刑。換了一塊2968以太網(wǎng)卡,沒再報(bào)網(wǎng)絡(luò)問題了。
1.3.創(chuàng)建增強(qiáng)并發(fā)訪問卷組進(jìn)行hacmp和數(shù)據(jù)庫配置之前,要先準(zhǔn)備資源,網(wǎng)絡(luò)(ip和tty)、appserver和以前沒什么區(qū)別,有特性的是共享卷組的準(zhǔn)備。
因?yàn)橐l(fā)處理,所以卷組要建成concurrent capable的,AIX 5.2下只支持Enhanced Concurrent卷組:
# mkvg -C -n -y datavg hdisk1
0516-1335 mkvg: This system does not support enhanced
concurrent capable volume groups.
以前在網(wǎng)上碰到同樣的報(bào)錯(cuò)求助,當(dāng)時(shí)是胡亂猜疑,不達(dá)要點(diǎn)。這回找到了真正的原因——沒有安裝bos.clvm.enh:
# lslpp -L bos.clvm.enh
Fileset Level State Type Description (Uninstaller)
----------------------------------------------------------------------------
bos.clvm.enh 5.2.0.40 A F Enhanced Concurrent Logical Volume Manager
安裝后,重新執(zhí)行mkvg就正常了。
硬件環(huán)境和軟件準(zhǔn)備好后,接下來配置HACMP。
二、HACMP安裝配置因?yàn)槭菍?shí)驗(yàn)環(huán)境,HACMP配置不是一開始就制定好的,修正過幾次,甚至到后面安裝oracle碰了釘子,又再回過頭來修改配置。
2.1. HACMP安裝在RAC下,必須安裝cluster.es.clvm.rte文件集,否則concurrent資源組無法增加并行卷組資源,安裝后需重新啟動(dòng)主機(jī),才可生效。
最后系統(tǒng)里所有的hacmp文件集列表如下:
Fileset Level State Type Description (Uninstaller)
----------------------------------------------------------------------------
cluster.adt.* 5.1.0.0 C F ES Client Demos
cluster.es.client.* 5.1.0.6 A F ES Client Libraries
cluster.es.clvm.rte 5.1.0.0 C F ES for AIX Concurrent Access
cluster.es.cspoc.* 5.1.0.6 A F ES CSPOC Commands
cluster.es.server.* 5.1.0.6 A F ES Server Diags
cluster.es.worksheets 5.1.0.6 A F Online Planning Worksheets
cluster.license 5.1.0.0 C F HACMP Electronic License
cluster.msg.* 5.1.0.0 C F HACMP CSPOC Messages - U.S. English
rac下,一般使用oracle自己的failover功能在客戶端實(shí)現(xiàn)服務(wù)主機(jī)的切換。但還希望借助hacmp實(shí)現(xiàn)單機(jī)上的網(wǎng)卡熱備,所以拓?fù)渑渲蒙嫌行┲v究。
想到cascading資源組中ipat會讓service-ip地址從主機(jī)飄到備機(jī)上(所不愿見到的),所以先使用persistent-ip。經(jīng)測試,persistent-ip可以在網(wǎng)卡失敗時(shí)切換到備份網(wǎng)卡(但比service-ip花的時(shí)間要長不少,客戶端中斷感覺明顯),功能基本滿足要求。但實(shí)際使用中,這種配置方法給后面的rac安裝造了不少麻煩,最后只能放棄。
在rac配置上掙扎很長一段時(shí)間,被周平一句話點(diǎn)醒,可以用配置僅包含單個(gè)節(jié)點(diǎn)的cascading資源組,來避免service-ip地址在主機(jī)間的漂移。最終的配置下,各種莫名其妙的問題迎刃而解(看來rac與hacmp的拓?fù)潢P(guān)系密切)。
最后的拓?fù)洹①Y源配置如下:
# /usr/es/sbin/cluster/utilities/cltopinfo -i
IP Label Network Type Node Address If Netmask
========= ======= ==== ==== ======= ==== =======
f80 net_ether_01 ether f80 10.0.0.208 255.255.255.0
p270 net_ether_01 ether f80 10.0.0.207 255.255.255.0
f80_boot2 net_ether_01 ether f80 192.168.1.208 en0 255.255.255.0
f80_boot1 net_ether_01 ether f80 192.168.0.208 en1 255.255.255.0
f80_tty1_01 net_rs232_01 rs232 f80 /dev/tty1 tty1
f80 net_ether_01 ether p270 10.0.0.208 255.255.255.0
p270 net_ether_01 ether p270 10.0.0.207 255.255.255.0
p270_boot1 net_ether_01 ether p270 192.168.0.207 en0 255.255.255.0
p270_boot2 net_ether_01 ether p270 192.168.1.207 en1 255.255.255.0
p270_tty1_01 net_rs232_01 rs232 p270 /dev/tty1 tty1
# /usr/es/sbin/cluster/utilities/clshowres
聲明:本網(wǎng)頁內(nèi)容旨在傳播知識,若有侵權(quán)等問題請及時(shí)與本網(wǎng)聯(lián)系,我們將在第一時(shí)間刪除處理。TEL:177 7030 7066 E-MAIL:11247931@qq.com