保護基礎(chǔ)架構(gòu)技巧之一:為所有設(shè)備保留備用設(shè)備
理想狀態(tài)下,你已經(jīng)對自己的網(wǎng)絡(luò)和服務(wù)器組件進行了標準化。當然,還會有某些比較奇怪的地方,但是你所有交換機應(yīng)該都來自同一品牌,或者是相同的型號。你的服務(wù)器必須屬于同一類型,或者至少它們的用途相同(比如惠普ProLiant DL360用于一個主基礎(chǔ)架構(gòu),然后Dell PowerEdge R415用于另一個)。這些服務(wù)器并不是很貴,特別是如果在以最低配置購買它們的時候。在緊要關(guān)頭,你可以用閑置不用的服務(wù)器來替代故障服務(wù)器,將一部分功能轉(zhuǎn)移到暫時不用的設(shè)備上去。在某些情況下,你甚至可以進行簡單地磁盤交換。
對于路由器和交換機也同樣如此。使用像RANCID這樣的工具來自動下載和存檔交換機和路由器配置,你可以把故障路由器和交換機的配置轉(zhuǎn)儲到備用設(shè)備上去以挽救局面。防火墻的工作方式相同。有時候,你甚至可以從eBay上拍賣到便宜的備用設(shè)備:不必在乎這些設(shè)備的維護問題,單單考慮自己的需求而把價格問題放在一邊就可以了。甚至你在運行Cisco ASA的時候,可能可以找到類似配置但是已經(jīng)絕版的Cisco PIX,或許只是花上幾百美元就可以在你遇到致命的服務(wù)器故障的時候救你一命。
保護基礎(chǔ)架構(gòu)技巧之二:有問題找維基
那個遠程辦公交換機的序列號應(yīng)該是什么?這臺路由器運行什么版本的IOS?我發(fā)現(xiàn)收集這些問題答案最簡單的辦法就是求助于維基。把CentOS安置在一臺虛擬機上并安裝維基百科,然后開始在你的基礎(chǔ)架構(gòu)上進行資料的編制。我就把很多Cisco設(shè)備的信息直接粘貼到維基頁面上去,或者在上面詳細描述某些交換機的特點和功能。這樣,在出現(xiàn)差錯的時候,我就可以迅速地找到所需的信息,把本來需要花費三個小時來完成的工作在三十分鐘內(nèi)解決。
對于儲存在維基上的文檔,我并沒有設(shè)置密碼。可能需要記錄的條目有很多:一些控制臺服務(wù)器端口的羅列、交換機端口的分配、每臺服務(wù)器的品牌、型號、序列號、功能、存儲和內(nèi)存配置等等。如果這些一旦存在于你的基礎(chǔ)架構(gòu)之中,就應(yīng)該單獨在維基中列出一個條目。
從頭開始做這項工程可能是件很痛苦的事情,但是在進行某項事情的時候記錄它卻很容易做到。如此一來,在下次你想立刻找出故障的遠程交換機的序列號的時候,你就可以輕而易舉地查找出來了。
推薦閱讀:系統(tǒng)管理員應(yīng)該怎樣高效的書寫文檔
保護基礎(chǔ)架構(gòu)技巧之三:建立隨時隨地可以進行連接的備份
如果可能的話,應(yīng)該配備很多路徑通向每個數(shù)據(jù)中心和遠程辦公室。在早些時候,這么做需要十分高昂的成本,但是現(xiàn)在你可以使用企業(yè)級的DSL或者電纜來連接你所有的辦公地點。大多數(shù)情況下的花費不會超過100美元一個月,不過這能讓你在緊急情況下有一個備用的登陸某個辦公地址的路徑。你甚至可以切斷通往這些地址的信息流量,然后把企業(yè)信息流量轉(zhuǎn)移到租用專線上,把網(wǎng)絡(luò)瀏覽信息流量轉(zhuǎn)移到DSL上去。
如果成本是最終問題,你可以仿效技巧一的做法,為這條線路從eBay上購買一個已經(jīng)使用過的防火墻。因為這對于生產(chǎn)無關(guān)緊要,所以你不用太在意設(shè)備的可靠性。二手的商品對于緊張的預算而言再合適不過了。
推薦專題:Linux 系統(tǒng)備份——操作實踐與工具介紹
保護基礎(chǔ)架構(gòu)技巧之四:準備備用服務(wù)器
這一條只適用于虛擬基礎(chǔ)架構(gòu)。假設(shè)你擁有一個由一系列1U服務(wù)器組成的虛擬基礎(chǔ)架構(gòu),并在該架構(gòu)上運行幾百臺虛擬機,如果一旦系統(tǒng)出現(xiàn)問題,你可能會運行這些虛擬機的部分子設(shè)備來維持關(guān)鍵的商業(yè)應(yīng)用程序。在這種情況下,你沒有必要去建立并維護該虛擬基礎(chǔ)架構(gòu)的復制版本,不過,你可以花錢購買一臺配置了大量內(nèi)存的4CPU服務(wù)器,它可以在一定的時間內(nèi)為你承擔一些生產(chǎn)負荷。
在整個虛擬架構(gòu)中,這臺服務(wù)器將在平時不發(fā)揮任何作用(盡管它可以),但是在需要的時候,它必須時刻準備著處理突發(fā)的工作負載。有時候,為了避免花在處于休眠服務(wù)器許可證上的費用,你甚至可以躲開虛擬化廠商的評估期。
至于這種緊急狀態(tài)下使用的服務(wù)器的大小,應(yīng)該與你的基礎(chǔ)架構(gòu)的需求以及你所期望運行的虛擬機的數(shù)量相吻合。一般來說,在一個虛擬環(huán)境下,你可以在花費少于一萬美元的情況下?lián)碛锌捎^的緊急情況處理能力。用這些錢購買一個“安心”難道不值得嗎?
保護基礎(chǔ)架構(gòu)技巧之五:學習Linux
即便你是一家Windows廠商,對于Linux充分的了解和學習也可以為你提供很多高價值并且低成本的選擇。你可能不太適應(yīng)在Linux上運行關(guān)鍵的商業(yè)應(yīng)用程序,但是Linux和Unix擁有令人難以置信的海量開源網(wǎng)絡(luò)和系統(tǒng)監(jiān)控和維護工具。雖然Windows版本也有很多這樣的工具,但是它們大多也是來源于Unix。
我曾經(jīng)被指責過渡偏愛一些全面監(jiān)控和維護補丁,比如Nagios、Cacti、RANCID等等。但是事實上,這些工具真的會為你的日常IT操作和問題解決方式帶來很大的變化。學習Linux并且使用這些工具的好處是雙重的:第一,你可以獲得Linux技巧;第二,可以使用大量的支持工具來豐富你的網(wǎng)絡(luò),讓每個人的工作生活都變得更加簡單。
在這個故障百出、換亂不堪的IT世界里,說得總是比做的要容易。這里,引用一句老諺語:如果你因為忙著擦地板而忘記關(guān)掉水龍頭,那么或許你應(yīng)該重新考慮一下自己做事情的方式。
原文:Five ways to bulletproof your infrastructure 作者:Paul Venezia