專訪:Compuware北亞區高級技術顧問 閻韶華
IT的最終目標是要交付給用戶一個個應用,讓用戶有良好的應用體驗。運維可以保證IT系統的穩定和服務水平,同時在標準的指導下,讓IT服務的結構和流程更加規范,為交付給最終用戶的服務提供體系保障。
用戶體驗至關重要
現在IT運維的一個發展趨勢是:對于基礎設施的監控,逐漸由信息化發達的一線企業向二、三線企業市場拓展,整個IT運維管理的市場已經偏成熟。但是我們在做IT運維的過程中會發現,雖然建立了一個很復雜的流程,有很多的業務監控產品,到最后究竟對于業務交付了什么,這點卻很難把握。而且新的各種應用整合進來之后,應該怎樣去度量服務質量,這也很難說清楚。那么投資回報如何體現?投入了很多人力和物力,對最終用戶有什么樣的貢獻,這確實需要一種手段去把它量化出來。
現在應用的邏輯結構越來越復雜,很多應用到最終用戶那里才組織成一個完整的頁面。因此,如果不能給用戶一個明確的問題答復,用戶則會認為自己的價值受到了侵害,這就不是一個好的用戶應用體驗。要本著對用戶負責的態度,對于問題的導致原因、何時恢復等方面都要做出回應,這樣才能在運營提供商這個競爭的市場中體現出自己的競爭力。用戶在選擇的時候一方面會考察產品本身質量如何,另一方面是注重在購買、消費的過程中的感受,所以用戶體驗非常重要。
運維中的可用性、加載速度等相關指標,都需要在了解用戶的體驗前提下才能確定,而且系統監控得到的一些內部數據并不能反映用戶層面的真實情況。度量與用戶交互,從而了解用戶體驗,權衡并優化服務設計和服務運維的各方面能力是一個從外部到內部逐層細化的過程。
要提升用戶體驗的質量,首先要發現用戶業務和步驟過程中出現的性能問題,其次通過相應的流程確定問題的嚴重程度及影響范圍,之后安排排查的人員就相對容易了。接下來是在這個價值鏈里判斷問題出在哪一段,首先排除是外部的問題或者是內部的問題,外部的可能是運營商的問題,也有可能是第三方,如內容提供商或互聯網加速的問題;內部問題就要通過剝洋蔥的方式,結合各層面的系統監視數據和應用本身的實際表現進行問題定位。
標準出臺是好事
運維標準,是不斷本地化的分散過程,但標準的制定不能脫離一定的基準。標準的兩類服務對象包括:一是IT運營者和管理者去規范操作的流程與步驟、資產的質量,二是對管理層、對業務有個交代。我對國家制定出的網絡可用性標準能否在不同的企業中進行普及有疑問,因為一些重點科研項目的質量標準和普通項目的標準是完全不同的:一線城市的小區寬帶和三線城市2G手機上網的用戶基礎忍耐度是不同的;用戶對瀏覽產品目錄,搜索產品和購買的性能感受期望值也是不同的。國家標準或者說行業標準對于運維的戰略層面是有價值的,我們在實踐也看到了它的作用,比如說8秒忍耐和10秒受挫這樣的性能門限,比如說99%網絡可用性和96%交易內容可用性門限,以及六西格瑪用戶可用性門限;但細化到關鍵交易層面必須根據操作的特性、用戶的當前期望、行業均值和服務容量進行實例化。最終的服務質量交付到何種程度、當前情況與目標的差距、如何優化等需方問題,從標準上來講應該是要優先解決的,這樣才能制定IT服務結構、流程等方面的規范。因此,這個服務質量標準的確立一定要是很科學、很合理才行。
一般來說,標準都是從經驗積累出來的。就像業界主流廠商的平均可用性是97.8%,這個數據不是憑空想象的,而是根據所有企業實際測試得出的可用性指標結合加載時間綜合后得出的。一個務實的企業,一方面會參考國家的標準,另一方面還要考慮如何利用自己已有的資金與資源,來最大程度地提高自己的競爭力,實現高質量的運維服務。
從另一個角度講,標準實際上提供了一個經過驗證的可行思路,根據這個思路可以了解現在的服務質量,更科學地設定服務質量目標,再優化與驗證它。提供一個可參考性的標準,把流程固化、流程簡化,并且讓流程適應業務的變化,最終還要不斷優化。以前在可用性和連續性方面的標準比較模糊,雖然這兩方面是單一的流程,但這個流程才是真正的體現IT運維價值所在的關鍵。
運維以服務水平為目標
IT運維,對于企業內部,是如何體現IT運維的價值;對于外部,是如何提升IT服務的水平。
IT服務環境變化較多,涉及到很多技術,也有很多新的服務出現,比如云計算、軟件即服務、平臺即服務、基礎設施即服務等具有更強靈活性的服務,這些對用戶都有很大的誘惑:一方面有更強的靈活性,可以快速部署;另一方面可以降低運維管理的成本,可以實現更好的服務水平。
在選擇不同云服務的時候,要考察它交付給最終用戶的質量如何,是否適合自己業務的外包。Compuware開發了開放的平臺“云偵探”,給外包服務企業、準備涉足云環境的企業以及云提供商提供一個公開的測試平臺,可以把企業關注的應用做一個腳本放在這個平臺里測試,而Compuware負責在全球骨干網測試節點和最終用戶測試節點幫助企業去做這些測試。這些測試是對企業放在云里的服務進行主動的評估與測試,再把數據采集回來,呈現給企業。這些結果可以做為整個云性能的評估參數,還有多種手段可以幫助他們進行技術評估和交流,從而在選擇云服務的時候給出合理的建議。