保護(hù)基礎(chǔ)架構(gòu)技巧之一:為所有設(shè)備保留備用設(shè)備
理想狀態(tài)下,你已經(jīng)對(duì)自己的網(wǎng)絡(luò)和服務(wù)器組件進(jìn)行了標(biāo)準(zhǔn)化。當(dāng)然,還會(huì)有某些比較奇怪的地方,但是你所有交換機(jī)應(yīng)該都來自同一品牌,或者是相同的型號(hào)。你的服務(wù)器必須屬于同一類型,或者至少它們的用途相同(比如惠普ProLiant DL360用于一個(gè)主基礎(chǔ)架構(gòu),然后Dell PowerEdge R415用于另一個(gè))。這些服務(wù)器并不是很貴,特別是如果在以最低配置購(gòu)買它們的時(shí)候。在緊要關(guān)頭,你可以用閑置不用的服務(wù)器來替代故障服務(wù)器,將一部分功能轉(zhuǎn)移到暫時(shí)不用的設(shè)備上去。在某些情況下,你甚至可以進(jìn)行簡(jiǎn)單地磁盤交換。
對(duì)于路由器和交換機(jī)也同樣如此。使用像RANCID這樣的工具來自動(dòng)下載和存檔交換機(jī)和路由器配置,你可以把故障路由器和交換機(jī)的配置轉(zhuǎn)儲(chǔ)到備用設(shè)備上去以挽救局面。防火墻的工作方式相同。有時(shí)候,你甚至可以從eBay上拍賣到便宜的備用設(shè)備:不必在乎這些設(shè)備的維護(hù)問題,單單考慮自己的需求而把價(jià)格問題放在一邊就可以了。甚至你在運(yùn)行Cisco ASA的時(shí)候,可能可以找到類似配置但是已經(jīng)絕版的Cisco PIX,或許只是花上幾百美元就可以在你遇到致命的服務(wù)器故障的時(shí)候救你一命。
保護(hù)基礎(chǔ)架構(gòu)技巧之二:有問題找維基
那個(gè)遠(yuǎn)程辦公交換機(jī)的序列號(hào)應(yīng)該是什么?這臺(tái)路由器運(yùn)行什么版本的IOS?我發(fā)現(xiàn)收集這些問題答案最簡(jiǎn)單的辦法就是求助于維基。把CentOS安置在一臺(tái)虛擬機(jī)上并安裝維基百科,然后開始在你的基礎(chǔ)架構(gòu)上進(jìn)行資料的編制。我就把很多Cisco設(shè)備的信息直接粘貼到維基頁面上去,或者在上面詳細(xì)描述某些交換機(jī)的特點(diǎn)和功能。這樣,在出現(xiàn)差錯(cuò)的時(shí)候,我就可以迅速地找到所需的信息,把本來需要花費(fèi)三個(gè)小時(shí)來完成的工作在三十分鐘內(nèi)解決。
對(duì)于儲(chǔ)存在維基上的文檔,我并沒有設(shè)置密碼。可能需要記錄的條目有很多:一些控制臺(tái)服務(wù)器端口的羅列、交換機(jī)端口的分配、每臺(tái)服務(wù)器的品牌、型號(hào)、序列號(hào)、功能、存儲(chǔ)和內(nèi)存配置等等。如果這些一旦存在于你的基礎(chǔ)架構(gòu)之中,就應(yīng)該單獨(dú)在維基中列出一個(gè)條目。
從頭開始做這項(xiàng)工程可能是件很痛苦的事情,但是在進(jìn)行某項(xiàng)事情的時(shí)候記錄它卻很容易做到。如此一來,在下次你想立刻找出故障的遠(yuǎn)程交換機(jī)的序列號(hào)的時(shí)候,你就可以輕而易舉地查找出來了。
推薦閱讀:系統(tǒng)管理員應(yīng)該怎樣高效的書寫文檔
保護(hù)基礎(chǔ)架構(gòu)技巧之三:建立隨時(shí)隨地可以進(jìn)行連接的備份
如果可能的話,應(yīng)該配備很多路徑通向每個(gè)數(shù)據(jù)中心和遠(yuǎn)程辦公室。在早些時(shí)候,這么做需要十分高昂的成本,但是現(xiàn)在你可以使用企業(yè)級(jí)的DSL或者電纜來連接你所有的辦公地點(diǎn)。大多數(shù)情況下的花費(fèi)不會(huì)超過100美元一個(gè)月,不過這能讓你在緊急情況下有一個(gè)備用的登陸某個(gè)辦公地址的路徑。你甚至可以切斷通往這些地址的信息流量,然后把企業(yè)信息流量轉(zhuǎn)移到租用專線上,把網(wǎng)絡(luò)瀏覽信息流量轉(zhuǎn)移到DSL上去。
如果成本是最終問題,你可以仿效技巧一的做法,為這條線路從eBay上購(gòu)買一個(gè)已經(jīng)使用過的防火墻。因?yàn)檫@對(duì)于生產(chǎn)無關(guān)緊要,所以你不用太在意設(shè)備的可靠性。二手的商品對(duì)于緊張的預(yù)算而言再合適不過了。
推薦專題:Linux 系統(tǒng)備份——操作實(shí)踐與工具介紹
保護(hù)基礎(chǔ)架構(gòu)技巧之四:準(zhǔn)備備用服務(wù)器
這一條只適用于虛擬基礎(chǔ)架構(gòu)。假設(shè)你擁有一個(gè)由一系列1U服務(wù)器組成的虛擬基礎(chǔ)架構(gòu),并在該架構(gòu)上運(yùn)行幾百臺(tái)虛擬機(jī),如果一旦系統(tǒng)出現(xiàn)問題,你可能會(huì)運(yùn)行這些虛擬機(jī)的部分子設(shè)備來維持關(guān)鍵的商業(yè)應(yīng)用程序。在這種情況下,你沒有必要去建立并維護(hù)該虛擬基礎(chǔ)架構(gòu)的復(fù)制版本,不過,你可以花錢購(gòu)買一臺(tái)配置了大量?jī)?nèi)存的4CPU服務(wù)器,它可以在一定的時(shí)間內(nèi)為你承擔(dān)一些生產(chǎn)負(fù)荷。
在整個(gè)虛擬架構(gòu)中,這臺(tái)服務(wù)器將在平時(shí)不發(fā)揮任何作用(盡管它可以),但是在需要的時(shí)候,它必須時(shí)刻準(zhǔn)備著處理突發(fā)的工作負(fù)載。有時(shí)候,為了避免花在處于休眠服務(wù)器許可證上的費(fèi)用,你甚至可以躲開虛擬化廠商的評(píng)估期。
至于這種緊急狀態(tài)下使用的服務(wù)器的大小,應(yīng)該與你的基礎(chǔ)架構(gòu)的需求以及你所期望運(yùn)行的虛擬機(jī)的數(shù)量相吻合。一般來說,在一個(gè)虛擬環(huán)境下,你可以在花費(fèi)少于一萬美元的情況下?lián)碛锌捎^的緊急情況處理能力。用這些錢購(gòu)買一個(gè)“安心”難道不值得嗎?
保護(hù)基礎(chǔ)架構(gòu)技巧之五:學(xué)習(xí)Linux
即便你是一家Windows廠商,對(duì)于Linux充分的了解和學(xué)習(xí)也可以為你提供很多高價(jià)值并且低成本的選擇。你可能不太適應(yīng)在Linux上運(yùn)行關(guān)鍵的商業(yè)應(yīng)用程序,但是Linux和Unix擁有令人難以置信的海量開源網(wǎng)絡(luò)和系統(tǒng)監(jiān)控和維護(hù)工具。雖然Windows版本也有很多這樣的工具,但是它們大多也是來源于Unix。
我曾經(jīng)被指責(zé)過渡偏愛一些全面監(jiān)控和維護(hù)補(bǔ)丁,比如Nagios、Cacti、RANCID等等。但是事實(shí)上,這些工具真的會(huì)為你的日常IT操作和問題解決方式帶來很大的變化。學(xué)習(xí)Linux并且使用這些工具的好處是雙重的:第一,你可以獲得Linux技巧;第二,可以使用大量的支持工具來豐富你的網(wǎng)絡(luò),讓每個(gè)人的工作生活都變得更加簡(jiǎn)單。
在這個(gè)故障百出、換亂不堪的IT世界里,說得總是比做的要容易。這里,引用一句老諺語:如果你因?yàn)槊χ恋匕宥涥P(guān)掉水龍頭,那么或許你應(yīng)該重新考慮一下自己做事情的方式。
原文:Five ways to bulletproof your infrastructure 作者:Paul Venezia