IT人的工作壓力指數一直高居不下,而在這個群體中從事技術維護的網絡管理員們,一樣也無法逃脫因為工作環境“惡略”造成的信心缺乏。如今,在任何一個企業的IT建設過程當中,網管員在整個系統當中都承擔著非常重要的責任和使命,他們的作用直接關系到企業信息化建設和使用過程中的成敗,不論系統的選型、構建、維護、升級,這些人的努力把IT的身影映輝得更佳閃亮。但是,這類人群本身和他們所承擔的壓力,長期以來卻是比較受忽視的,自嘲的我們把網絡管理比喻為一個沒有幸福感的牢籠,那么,網管員應該如何做才能完成自己的救贖呢?
網管員忙碌的一天
鄭滿是一名制造企業的系統運維工程師,由于名字的諧音,再加上平時工作的忙碌狀態,大家都管他叫“真忙”。那么他每天都在忙些什么呢?
“真忙”由于昨天加班很晚,早上遲到了。帶著被扣錢的心情坐到了自己的工位上,馬上利用各種命令檢查業務系統核心設備的連通性,還好沒有出現什么問題。接下來,根據領導的要求,開始檢查公司這100多臺服務器的日志,因為時間消耗太長,后面的只能走馬觀花,對著一堆狀態檢測表格,只能都打上“√”。11點左右,他又遇到了業務部門關于“上網慢、查詢數據慢”等一系列“慢”的投訴,反正已經習慣了,先不理會。下午遇到了CRM服務器宕機的緊急事件、在一系列的打電話、查問題、找故障的加班之后,日報又不知道如何去寫?回家的路上,地鐵里的人已經漸漸稀少,移動電視里播放著關于“市民幸福感的采訪錄像”,“真忙”腦子里一片汪洋,他琢磨著:“日復一日,職場競爭激烈,想學習一些新技術也沒有時間,身體也變得越來越臃腫。要是因為成天加班,女朋友再鬧……”
與“真忙”一樣,很多從事網絡管理工作的人,每一天的生活其實是忙碌而痛苦的。很多企業為了對網絡和IT系統進行定時巡查,就事前打印了無數的表格,然后通過三班倒的方式,每個值班人員就按照打印的表格要求,登錄到固定的服務器和網絡設備上,去查看設備的CPU利用率,網絡延時等信息,然后通過打對鉤或者打叉來說明現在系統的運行狀態。而如果業務部門在訪問IT業務系統時,如果出現問題,則是直接打電話到IT部門,誰接著電話,就用筆直接記錄在故障單上,然后處理。如果一般性的問題,可能業務部門的人員和IT部門的人員直接就在QQ上聊天交流,直到問題解決完成。如果遇到緊急故障,加班、挨罵的事情是常有的。
改變,從基礎設施的運維開始
據我們了解,目前很多企業的IT運維水平仍然是處于這種狀態,雖然我們天天都在喊著“穩定高于一切”,但實際的工作狀態卻是一塌糊涂。那么,接下來讓我們來談談關于“改變”的話題吧。
很多專家會說,讓你們公司實施ITIL、ITSM、BSM呀。沒錯,這些IT運維前輩們總結出來的IT服務管理(ITSM)理念和標準(ITIL)的精髓為企業提供了很好的借鑒,也確實可以讓網管員的工作變得有章可循。但再好的理論,如果上來就構建一個空中樓閣的設想,我們也仍然是在紙上談兵。
作為國內領先的IT運維管理產品和服務提供商,在IT運維管理前沿積累了長期寶貴經驗的北塔軟件認為:“事實上,在一些運維方法處于起步階段的企業而言, 一上來就要全套照搬那些國際化的IT管理方法,還不如先解決設備層面的監控和預警難題,因為這個前提不具備,任何其他的IT管理都是行不通的。
IT基礎設施的管理看起來簡單,但實際上卻有著很強的專業性,隨著企業規模和IT系統的擴展,子系統不斷增加,網管員的壓力會一天比一天加大。而之前只維護一兩套系統的從容狀態、幸福感也會一天天的消失。相對比,采用集中運維管理工具的網管員都知道,對于主機和網絡系統的監控大都是網絡連通性、設備負載、TCP告警、端口狀態以及流量、線路狀態以及流量、設備日志信息、設備配置變動、SNMP連通性以及Trap這些信息等。但面對成百上千或上萬設備組成的網絡,服務器死機、硬件故障概率是非常大的,幾乎每時每刻都有服務硬件問題,死機、硬盤損壞、電源、內存、交換機故障出現。針對這種情況,必須有一套綜合的IT運維管理平臺才能讓我們找回失去的幸福。
志向遠大的網管員
“真忙”最希望的是把網絡、路由器、交換機、服務器等納入一個平臺上進行管理,保證其運行不出問題。因為只有通過IT基礎設施管理服務的建設,他和同事才有能力提供7X24小時全天候對服務器、網絡和數據庫進行監控。
網絡管理部門會習慣,他們為業務部門服務,而運維系統為自己服務的工作狀態。以北塔BTIM(Betasoft Integrated Management,IT綜合管理軟件)為例,我們看看這套系統是在一天的工作中是如何幫助“真忙”改變消沉已久的運維現狀:
● 9:00,登錄到BTIM管理系統,進行例行檢查,包括查看綜合視圖,查看告警信息等。
● 9:20,查看業務系統的運行情況,分別打開服務器、數據庫、中間件的數據流轉圖,查看性能指標。
● 9:40,將下屬單位新加的一臺網絡設備線路設置為監控狀態,同時根據開發部門告知新增數據庫的通知,并將其命名為“XX業務數據庫”。
● 9:50~12:00,看書,網上查資料。
● 12:00~13:30,午餐、給女友上淘寶選生日禮物。
● 13:50,根據今天和之前一周的報表,確定最近網絡設備比較繁忙,調高閾值到80%才變紅色,之后繼續看書、查資料。
● 14:50~15:30,按照領導要求,完成了三項工作,之后登陸一些關注的IT網站,看看今天的新聞和技術趨勢:
(1)要求監控公司主頁,增加了一條URL的監控告警設置。
(2)在BTIM中查詢下個月就要過保修期的設備清單。
(3)根據BTIM自動生成的核心設備運行情況,制作出一張核心設備運行率報表,完成月報。
● 17:50,快下班了,對所有線路今天的流量做了一個Top10排序。
● 18:00,準時下班,但發現地鐵很擁擠,“鍛煉身體的時間”又到了。
看過這樣一份時間表我們發現,通過IT基礎設施綜合管理平臺的建設,“真忙”如今可以從容地管理網絡、安全、機房、服務器、數據庫、中間件、應用等各個方面的細節。同時,由于BTIM運維系統可以提供性能、故障、各類數據流分析、資產管理報表,網管員也不必天天加班了。
你可能發現,除了日常的運維工作,主人公剩下的時間多被看書和查資料占用了。原因很簡單,“真忙”已經把自己網管員職業發展方向定位了技術專家,因為他已經不再甘心當一名技術藍領。IT運維軟件不僅是IT系統的救贖,更是網管hold住幸福的起點。從某種意義上說,不再毫無目的的忙碌才是幸福的關鍵,至少從事這項工作的我們是這樣認為的。