在 Exchange 2003 中,通常都能快速恢復(fù)服務(wù)而不管數(shù)據(jù)庫(kù)故障發(fā)生于一天中的哪個(gè)時(shí)間段。從前一夜的磁盤(pán)到磁盤(pán)備份恢復(fù)數(shù)據(jù)的過(guò)程不是等到非工作時(shí)間進(jìn)行,而是立即開(kāi)始。
為了盡可能快地恢復(fù)數(shù)據(jù),OTG 可以使用一種稱為 RSG 新的 Exchange 2003 特性,這是一個(gè)特殊的離線 SG,專門用于從備份重建一個(gè)丟失的 SG。雖然 Exchange 2003 在生產(chǎn)中只為用戶支持四個(gè) SG,它現(xiàn)在支持 RSG 作為一個(gè)額外的離線 SG - 一個(gè)不支持生產(chǎn)用戶訪問(wèn)的 SG。
OTG 創(chuàng)建一個(gè)臨時(shí) RSG 并將受損的數(shù)據(jù)庫(kù)從備份源恢復(fù)到臨時(shí) RSG 中。一旦從備份的恢復(fù)完成了,從故障點(diǎn)到備份完成這段時(shí)間內(nèi)產(chǎn)生的數(shù)據(jù)通過(guò)重播事務(wù)日志進(jìn)行恢復(fù)。這一過(guò)程大大加快了恢復(fù)用戶消息服務(wù)和從受損數(shù)據(jù)庫(kù)恢復(fù)他們的數(shù)據(jù)的速度。當(dāng)事務(wù)日志的重演完成后,已恢復(fù)的數(shù)據(jù)庫(kù)在 RSG 和新的已清除的 SG 數(shù)據(jù)庫(kù)之間交換。然后在電子郵件服務(wù)的恢復(fù)時(shí)刻和數(shù)據(jù)恢復(fù)完成時(shí)刻之間產(chǎn)生的所有新數(shù)據(jù)從被清除數(shù)據(jù)中導(dǎo)出并使用 Microsoft Exchange Mailbox Merge Wizard(也叫做 ExMerge)導(dǎo)入到已恢復(fù)的數(shù)據(jù)庫(kù)中。RSG 隨后被刪除。因?yàn)閿?shù)據(jù)庫(kù)恢復(fù)速度受限于基于 LAN 的磁帶,此方法也可以用于舊式的非集群服務(wù)器,當(dāng)前它們正處于整合過(guò)程中。在大型的存儲(chǔ)故障中,必須恢復(fù)大量的數(shù)據(jù),而且許多郵箱在數(shù)據(jù)恢復(fù)之前可能要等待很長(zhǎng)時(shí)間。
更多有關(guān) OTG 的 Exchange Server 2003 備份與恢復(fù)的信息,請(qǐng)參閱 http://www.microsoft.com/china/technet/itsolutions/msit/default.mspx 頁(yè)面上題為“Microsoft 的消息備份與恢復(fù)”的 iT Showcase 技術(shù)案例研究。
未來(lái)的備份技術(shù)
OTG 當(dāng)前正在測(cè)試將 Window Server 2003 的一個(gè)稱為卷影復(fù)制服務(wù)(VSS)的新特性用于一步的 Exchange 備份。此服務(wù)允許基于本地文件系統(tǒng)或基于特定廠商存儲(chǔ)的數(shù)據(jù)快照功能。
VSS 提供了克隆磁盤(pán)數(shù)據(jù)、在單個(gè)時(shí)間點(diǎn)創(chuàng)建該數(shù)據(jù)的鏡像的能力。OTG 的目標(biāo)是結(jié)束它對(duì)當(dāng)前的兩段式在線備份過(guò)程的依賴,轉(zhuǎn)而使用 VSS 在午夜克隆它的服務(wù)器,然后在中午 12 點(diǎn)和下午 6 點(diǎn)對(duì)一套新的克隆 LUN 使用 VSS 差分快照。在一個(gè)事故中,OTG 將根據(jù)數(shù)據(jù)損失的范圍和事故發(fā)生的時(shí)間段來(lái)決定是使用最后已知良好 VSS 克隆還是使用快照來(lái)恢復(fù)數(shù)據(jù)。例如,如果在下午 2 點(diǎn)后,一個(gè)數(shù)據(jù)庫(kù)因?yàn)槭軗p而離線,那么恢復(fù)該數(shù)據(jù)庫(kù)數(shù)據(jù)和服務(wù)的最容易和最快速的方法是從中午的快照恢復(fù)數(shù)據(jù)。如果在深夜探測(cè)到數(shù)據(jù)庫(kù)損壞,因?yàn)槟菚r(shí)候的通信量負(fù)載很輕,所以從最后克隆恢復(fù)數(shù)據(jù)是更可取的方法。如果使用 VSS 恢復(fù)大量的數(shù)據(jù),今天需要幾小時(shí)的時(shí)間才能完成的恢復(fù)任務(wù)僅需幾分鐘就夠了。
VSS 作為一個(gè)備份解決方案,需要依賴許多第三方工具才能使它高效工作。需要一個(gè)請(qǐng)求程序、一個(gè)供應(yīng)程序和一個(gè)寫(xiě)入程序。OTG 正在測(cè)試將 VSS 作為“快照加克隆”集成的可能的解決方案的運(yùn)作優(yōu)點(diǎn)。到撰寫(xiě)本文時(shí)為止,VSS 還沒(méi)有用于 OTG 的生產(chǎn)備份,仍然處于測(cè)試階段。
使用 Microsoft Operations Manager(MOM)2000 進(jìn)行管理和監(jiān)視
在 Exchange 2000 中,OTG 使用一個(gè)內(nèi)部開(kāi)發(fā)的名為 Prospector 的工具來(lái)監(jiān)視 Exchange server。Prospector 監(jiān)視關(guān)鍵的指示器,如服務(wù)運(yùn)行、安裝的服務(wù)器以及磁盤(pán)使用率。Prospector 非常高效,但用處有限。
在 OTG 開(kāi)始移植到 Exchange 2003 之前不久,OTG 決定從 Prospector 移植到帶有 MOM Exchange Management Pack 的MOM 2000來(lái)管理它的 Exchange server。MOM 是一個(gè)企業(yè)系統(tǒng)管理應(yīng)用程序,它使用一個(gè)客戶端代理從被監(jiān)視服務(wù)器的事件日志中收集預(yù)定義的事件,并存入一個(gè)中央數(shù)據(jù)庫(kù)。它還會(huì)創(chuàng)建警告來(lái)響應(yīng)預(yù)定義事件,并將其路由到受數(shù)據(jù)中心操作人員監(jiān)視的中央控制臺(tái)。
除了許多其它功能之外,MOM 還為 Exchange Server 提供了特殊的管理規(guī)范。受監(jiān)視的關(guān)鍵 Exchange 2003 管理數(shù)據(jù)包括服務(wù)器狀態(tài)、性能標(biāo)準(zhǔn)和消息隊(duì)列狀態(tài)。MOM 還提供了可自定義的“知識(shí)腳本”(KS),它使系統(tǒng)管理員能夠?yàn)椴僮飨到y(tǒng)或應(yīng)用程序創(chuàng)建特定的管理目標(biāo)。Microsoft 廣泛使用 MOM KS 功能來(lái)管理 Exchange 2003 環(huán)境。表 5 提供了 Microsoft 用于 Exchange 2003 的一些關(guān)鍵 MOM 知識(shí)腳本的概述。
表 5:用于 Microsoft Exchange 2003 部署的關(guān)鍵 MOM 知識(shí)腳本
知識(shí)腳本目的
Service Monitor輪詢重要的 Exchange 服務(wù),如 STORE.EXT,并在這些服務(wù)中斷時(shí)產(chǎn)生警報(bào)。
Backup Monitor此腳本監(jiān)視備份操作和數(shù)據(jù)庫(kù)以檢驗(yàn)常規(guī)備份操作是否正在進(jìn)行。此腳本列舉 SG,檢驗(yàn)日志文件和數(shù)據(jù)庫(kù)頭以確保它們已備份。
Disk Space Monitor此腳本檢驗(yàn)是否有足夠的磁盤(pán)空間用于事務(wù)日志、數(shù)據(jù)庫(kù)和備份卷。此腳本檢驗(yàn)是否有至少 20% 的可用空間。
Event Log Monitor此腳本檢查關(guān)鍵的 Exchange 2003 事件日志錯(cuò)誤。它還尋找已經(jīng)卸除的數(shù)據(jù)庫(kù)。
Availability Monitor此腳本通過(guò)在每個(gè)信息存儲(chǔ)上執(zhí)行測(cè)試登錄來(lái)檢驗(yàn) Exchange 服務(wù)是否可用。
Discovery此腳本為了配置管理目的對(duì)諸如軟件版本、service pack、驅(qū)動(dòng)程序等項(xiàng)目執(zhí)行版本發(fā)現(xiàn)。
Active Directory Monitor此腳本監(jiān)視 Exchange 2003 服務(wù)器以發(fā)現(xiàn)訪問(wèn) AD 方面的問(wèn)題。Global Catalog 和 DS_Access 錯(cuò)誤是此 KS 關(guān)注的關(guān)鍵問(wèn)題。
MOM 使用存儲(chǔ)轉(zhuǎn)發(fā)技術(shù)來(lái)收集事件,這樣即使在正常的服務(wù)器操作期間發(fā)生臨時(shí)網(wǎng)絡(luò)中斷,也能夠可靠地傳遞事件。MOM Application Management Packs 是一系列預(yù)定義的事件和閥值,用于捕獲與特定服務(wù)器應(yīng)用程序最相關(guān)的數(shù)據(jù)。
MOM 使用一種稱為配置組的組織結(jié)構(gòu)來(lái)管理被監(jiān)視的服務(wù)器。一個(gè)配置組通常由一個(gè)數(shù)據(jù)庫(kù)、一個(gè)或更多 DCAM(數(shù)據(jù)訪問(wèn)服務(wù)器 + 整合程序和代理管理器)服務(wù)器,以及一個(gè)或更多在所有被監(jiān)視計(jì)算機(jī)上運(yùn)行的代理組成。
一旦系統(tǒng)正常運(yùn)行,特別是在應(yīng)用了 MOM Exchange Management Pack 并針對(duì) OTG 的需求進(jìn)行了合適的調(diào)整之后,使用 MOM 通過(guò) WAN 來(lái)監(jiān)視服務(wù)器就只會(huì)造成非常少的網(wǎng)絡(luò)流量開(kāi)銷。因?yàn)檫@種高效率,早期的計(jì)劃(使用五個(gè) MOM 配置組以更好地管理 MOM 在 WAN 上的流量)被認(rèn)為不必要而被放棄了。該過(guò)程十分高效,因此 OTG 只需要一個(gè) MOM 配置組就能夠監(jiān)視全球所有的 Exchange server,而部署一個(gè) MOM 配置組服務(wù)器的成本只需 50,000 美元。
在調(diào)整 MOM Exchange Management Pack 時(shí),OTG 沒(méi)有采取修改默認(rèn)管理包的辦法,而是創(chuàng)建一個(gè)自定義 OTG 管理包來(lái)維護(hù)新的和已修改的規(guī)則。這包括收集默認(rèn)設(shè)置沒(méi)有指定的數(shù)據(jù)、改變默認(rèn)的數(shù)據(jù)收集參數(shù)和閥值等。OTG 仍然使用其自定義管理包來(lái)管理其處理環(huán)境中特有的特殊備份事件。OTG 將所有這些調(diào)整與整合反饋都提交給產(chǎn)品開(kāi)發(fā)組,讓他們將其包含到發(fā)布的產(chǎn)品中。
更多有關(guān) MOM 的信息,請(qǐng)參閱 http://www.microsoft.com/technet/itsolutions/msit/default.mspx 頁(yè)面上題為“Monitoring Messaging at Microsoft”的 IT Showcase 技術(shù)解決方案摘要和題為“Monitoring Enterprise Servers at Microsoft”的 iT Showcase 技術(shù)白皮書(shū)。
應(yīng)用程序管理
一旦 MOM 檢測(cè)到來(lái)自一個(gè)遠(yuǎn)程服務(wù)器的警報(bào),OTG 能夠使用 Windows Server 2003 中內(nèi)置的遠(yuǎn)程管理工具來(lái)訪問(wèn)該服務(wù)器以進(jìn)一步調(diào)查和診斷問(wèn)題。
遠(yuǎn)程管理桌面(Remote Desktop for Administration)與遠(yuǎn)程桌面協(xié)議(RDP)
OTG 使用 Windows Server 2003 和 Windows XP Professional 的遠(yuǎn)程管理桌面與 RDP 特性來(lái)維護(hù)遠(yuǎn)程的 Exchange 2003 server。遠(yuǎn)程管理桌面由終端服務(wù)技術(shù)啟用,是為服務(wù)器管理而專門設(shè)計(jì)的。因此,遠(yuǎn)程管理桌面可用于繁忙的服務(wù)器,且不會(huì)明顯影響處理器性能。這對(duì)遠(yuǎn)程管理來(lái)說(shuō)是一種便利、有效的服務(wù)。實(shí)際上,遠(yuǎn)程管理桌面用于登錄到遠(yuǎn)程服務(wù)器上,就像本地登錄一樣。
服務(wù)器管理
OTG 使用 MOM 來(lái)創(chuàng)建關(guān)于服務(wù)器性能的長(zhǎng)期趨勢(shì)數(shù)據(jù)。然而,MOM 能夠管理的最為主動(dòng)的趨勢(shì)循環(huán)是每隔五分鐘左右記錄一個(gè)數(shù)據(jù)檢查點(diǎn)。OTG 使用 Performance Monitor(PerfMon)- Windows Server 2003 中提供的一個(gè)工具 - 進(jìn)行更實(shí)時(shí)的性能監(jiān)視。
MOM 性能數(shù)據(jù)保存在八天的時(shí)間表中(當(dāng)天和之前的七天)。OTG 使用在 MOM 中捕獲的趨勢(shì)數(shù)據(jù)來(lái)跟蹤向 Exchange 服務(wù)器添加軟件補(bǔ)丁或硬件驅(qū)動(dòng)程序的性能提示。通過(guò)留意性能數(shù)據(jù)中的趨勢(shì)何時(shí)發(fā)生變化,并將其與末班員工變化中維護(hù)的 Exchange Server 環(huán)境服務(wù)器變更記錄相比較,OTG 能夠更加快速地將性能問(wèn)題和受益情況與在特定時(shí)間所做的特定更改聯(lián)系起來(lái)。鑒于 OTG 環(huán)境中極高的變化率,這是 OTG 診斷過(guò)程中的一個(gè)重要工具。
HP Insight Manager
HP Insight Manager 是第一個(gè)可用于 PC 服務(wù)器的服務(wù)器元素管理器。它在 1992 年發(fā)布。從那時(shí)起,Insight Manager 就奠定了它作為服務(wù)器平臺(tái)管理應(yīng)用程序的領(lǐng)先地位。OTG 廣泛地使用 Insight Manager 來(lái)監(jiān)視與 HP 硬件相關(guān)的信息。雖然 Insight Manager 沒(méi)有具體的 Exchange 管理數(shù)據(jù),系統(tǒng)管理器可以使用此工具將來(lái)自其他管理應(yīng)用程序的事件與 OTG 的 Exchange 2003 服務(wù)器上的特定硬件情況關(guān)聯(lián)起來(lái)。HP Insight Manager 還與 MOM 緊密結(jié)合,為系統(tǒng)管理器提供一個(gè)統(tǒng)一的管理平臺(tái)。表 6 顯示了一些 Insight Manager 為其提供管理數(shù)據(jù)的關(guān)鍵對(duì)象。
表 6 HP Insight Manager
對(duì)象Insight Manager 提供的數(shù)據(jù)
磁盤(pán)子系統(tǒng)Insight Manager 提供了廣泛的磁盤(pán)監(jiān)視與診斷信息,這些信息能夠與應(yīng)用程序事件(如 I/O 錯(cuò)誤)相關(guān)聯(lián)。
環(huán)境Insight Manager 提供了有關(guān)服務(wù)器環(huán)境特征的信息,如溫度、風(fēng)扇狀態(tài)和關(guān)鍵的 BIOS 錯(cuò)誤。
版本控制Insight Manager 的版本控制特性提供了有關(guān)固件、軟件和驅(qū)動(dòng)程序版本的詳細(xì)信息,對(duì)于配置管理很有幫助。
利用率Insight Manager 提供了關(guān)于處理器和 I/O 總線利用率的基于硬件的統(tǒng)計(jì)。
存儲(chǔ)管理
在 SAN 模組上發(fā)生的事件不會(huì)記錄到服務(wù)器的事件日志中,而 MOM 正是從事件日志中獲得許多警報(bào)的。相反,SAN 模組事件存儲(chǔ)在 HP Storage Manage Appliance(SMA)中。OTG 也配置 MOM 對(duì) SMA 上的事件進(jìn)行監(jiān)視,以便監(jiān)視 SAN 模組事件。在總部中,一對(duì) SAN 模組安裝一個(gè) SMA。在區(qū)域中,每個(gè) SAN 模組安裝一個(gè) SMA。結(jié)合 SMA 一起使用 MOM 能夠確保象監(jiān)視 Exchange 服務(wù)器那樣有效地監(jiān)視 OTG 的 SAN 模組。