用何種測量指標(biāo)和測量方式取決于使用它們的用戶。例如,制造商和軟件研發(fā)者與賣方和市場部門有不同的需求和關(guān)注領(lǐng)域。IT組織可能需要在宏觀或全局上關(guān)注數(shù)據(jù)的成本、能源使用量、服務(wù)器的數(shù)量或類型、存儲器容量或支持的事務(wù)數(shù)量等。測量指標(biāo)還需要隨時間而變化,包括在開發(fā)過程中對生產(chǎn)和質(zhì)量的保證、銷售和市場營銷、客戶的需求和安裝、集成測試和后續(xù)的支持。
指標(biāo)包括性能、可用性、容量和能源消耗以及一般的健康狀況和使用狀態(tài),還包括建立一個解決方案的可行性。對于各種使用場合,度量指標(biāo)可以解決何時使用IT資源來處理工作或移動數(shù)據(jù)以及數(shù)據(jù)不使用時如何存儲數(shù)據(jù)的問題。從PCFE的觀點來看,監(jiān)測IT資源需要與有效工作結(jié)合,存儲的數(shù)據(jù)量的測量要結(jié)合指定碳排放量和指定服務(wù)與費用等級。
圖5.3左側(cè)顯示了不同側(cè)重的測量指標(biāo),從處于底端的設(shè)施到頂端的商業(yè)和應(yīng)用程序。如圖5.3右側(cè)所示,各種測量方式和指標(biāo)可以滿足不同類別的資源管理基礎(chǔ)設(shè)施(IRM旬的監(jiān)測、通知、記錄、報告以及相關(guān)和分析工具的需求。
從PCFE的觀點來看,對能源消耗、費用、散熱量、二氧化碳排放量的測量指標(biāo)應(yīng)該被制定得靈活有效。IT資源必須對許多因素加以衡量和考慮,包括活動期或非活動期、環(huán)境、應(yīng)用程序、計算或I/O中心、正在被存儲的數(shù)據(jù)量(樣儲中心)與正在被處理的數(shù)據(jù)量和地理位置(它決定能源效率,可用性和排放量
以服務(wù)器為中心的環(huán)境,可以便用電力能源、冷卻服務(wù)器與存儲器以及其他IT設(shè)備進行比較。在一個存儲容量和I/O操作占較大比例、卻有較少的計算量和服務(wù)器資源的環(huán)境下,服務(wù)器可能會表現(xiàn)出較低的服務(wù)器性能和較高的存儲器(如磁盤和磁帶)的性能。記住,這些反映的都是平均情況,典型的環(huán)境和"實際里程將有所不同"都取決于具體情況。
建立一套測量基準(zhǔn)很重要,也是出于多方考慮的。它包括建立正常和異常行為標(biāo)準(zhǔn)、確定使用方式和性能模式的趨勢以及預(yù)測和規(guī)劃的目的。例如在知道了典型的I0P(輸入/輸出速率)和存儲設(shè)備的吞吐率以及常見的錯誤率、平均隊列深度和響應(yīng)時間后,問題產(chǎn)生或發(fā)生變化時,就可以快速做出比較和決策。
測量基準(zhǔn)的建立應(yīng)立足于資源性能和響應(yīng)時間、容量和空間利用率、可用性和能源消耗量。測量基準(zhǔn)也應(yīng)由不同的應(yīng)用程序工作方案而確定,以便了解如某些任務(wù)正常狀況下需要多久完成。測量基準(zhǔn)的IRM功能,包括數(shù)據(jù)庫的維護、備份、病毒檢查以及安全掃描,可用于對執(zhí)行任務(wù)時間過長或完成任務(wù)過快等情況進行監(jiān)視,因為以上這兩種情況都可能表明出現(xiàn)了問題。另一個例子是相對正常時的過高和過低的CPU利用率,可能表明因一個應(yīng)用程序或設(shè)備錯誤而導(dǎo)致CPU過度工作或?qū)φM行工作的阻礙。
為達(dá)到規(guī)劃的目的,由資源的使用及其他關(guān)鍵性能指標(biāo)可以繪制出圖5.4。圖5.4中顯示了可用資源容限、可接受服務(wù)的閱值、實際使用情況、可用性、性能和趨勢。確定通常低于設(shè)備物理極限的閡值。在給定的響應(yīng)時間、特殊性能要求或可用性水平下,閥值對進行的管理服務(wù)是很有用的。
例如,為滿足特定性能的響應(yīng)時間,服務(wù)器或存儲的性能可能會維持在較低的狀態(tài)。或者資源利用率可以有針對性地根據(jù)經(jīng)驗和歷史的準(zhǔn)線,令利用率低于一定的百分比,以確保在指定成本下交付可以接受的服務(wù)。
從預(yù)測和規(guī)劃的角度來看,隨著商業(yè)和應(yīng)用的增長,用測量基準(zhǔn)進行的比較可以用來確定或預(yù)測未來的資源使用需求。它的優(yōu)勢在于結(jié)合資源使用和性能容量計劃,在需要時可以及時、合理地得到正確的數(shù)量和資源的類型。與跨服務(wù)器、存儲、網(wǎng)絡(luò)和設(shè)施的容量計劃結(jié)合后,無論何時何地,當(dāng)需要用資源來支持服務(wù)器、存儲和網(wǎng)絡(luò)的增長時,即可保持不同的群體之間的通信。
表5.1列出了有關(guān)電能的說明和意見,包括如何轉(zhuǎn)換或解析己知的指標(biāo),以獲得一個未知的值。例如,如果你知道電力設(shè)備使用的瓦特量,除以已知的電壓,就可以確定安培量。同樣,如果你不知道設(shè)備使用的瓦特量,但你知道熱量,只要用熱量乘以0.293即可,如1000BTUXO.293=293W。例如,每瓦的I0PS指標(biāo)的計算萬法是用使用能源瓦數(shù)除以I0PS量。類似地,每瓦兆赫或每瓦帶寬是能源使用的兆赫或帶寬量除以瓦特數(shù)。
有些指標(biāo)是測量所得,其他的是由已得出的測量指標(biāo)或不同指標(biāo)的組合推導(dǎo)出來的。例如,存儲系統(tǒng)可能會在讀寫的基礎(chǔ)上報告讀寫數(shù)據(jù)量和1/0操作的數(shù)量。派生度量是用帶寬除以1/0操作數(shù)得到的平均1/0大小創(chuàng)建的。類似的,如果UO操作數(shù)量和平均1/0大小已知,相乘即可得到帶寬大小。不同的解決方案會報舌各種指標(biāo)在不同層次上的細(xì)節(jié)詳情。同樣,第三方測量和報告工具會根據(jù)數(shù)據(jù)源和收集能力在報告的細(xì)節(jié)上作相應(yīng)的變化。
字節(jié)數(shù)的計算是用包括二進制和十進制等在內(nèi)的不同的方法(如表5.2所示兒網(wǎng)絡(luò)通常用bit/s計算,而存儲和相關(guān)的I/0操作以每秒的字節(jié)數(shù)來計算。這通常被記做"bit"(位)和"B"(字節(jié))。表5.2中還有多種包括國際單位制的縮寫。
直觀上,能源應(yīng)該用每秒產(chǎn)生的焦耳量來計算,用以與每秒的活動對照。但結(jié)合能源的利用情況,電能的測量和報吉普遍上是在1kNh仍的基礎(chǔ)上。例如,如果設(shè)備消耗穩(wěn)定在1小時1000W,它將消耗1kNh或3600000J的能量。
指標(biāo)可以瞬間暴漲達(dá)到高峰,也可能是持續(xù)的一段時間,最大值、最小值、平均值和標(biāo)準(zhǔn)偏差加上總數(shù)累積。這些指標(biāo)可以用不同的時間間隔記錄和報古,例如按小時、日、周、月或年。
IT技術(shù)制造商在指定的方案下提供有關(guān)的電能消耗和(或)散熱情況的信息(BTU/h)。一些廠商提供更多的信息,包括最壞情況和最好情況的耗能資料,而其他廠商只提供了基本的最大交換機型號的信息。由供應(yīng)商公布的數(shù)據(jù)應(yīng)在設(shè)備上可見,如千瓦、千伏、安培、VAC或B]U等。在給定數(shù)據(jù)都可用的情況下,缺少的信息才能確定。例如,如果已知一個供應(yīng)商供應(yīng)的BTU/h,瓦數(shù)可以用BTU爪乘以0.293得到。這樣,一臺產(chǎn)熱10OOBTU/h的設(shè)備使用293W。
那些與回收、排放、空氣流通和溫度相關(guān)的指標(biāo)也可以由計算而得。其他指標(biāo)與服務(wù)器CPU、內(nèi)存、I/0、網(wǎng)絡(luò)利用率、能源利用率以及當(dāng)?shù)鼗騼?nèi)部存儲性能有關(guān)。復(fù)合指標(biāo)是來自于多個數(shù)據(jù)或計算。例如,當(dāng)IOPS數(shù)和瓦特這種基礎(chǔ)指標(biāo)已知時,可確定每瓦的IOPS,它可以被用來作為消耗單位能源能所做工作負(fù)載的指標(biāo)。
應(yīng)用程序指標(biāo)包括事務(wù)量、電子郵件、文件、照片、視頻或其他處理過的文件。數(shù)據(jù)保護數(shù)量指標(biāo),包括在特定時間內(nèi)幀傳輸?shù)臄?shù)據(jù)量、成功或失敗的備份或數(shù)據(jù)保護的任務(wù)、不同的任務(wù)和工作所用的時間以及其他錯誤和活動的信息。配置管理的信息包括不同類型的服務(wù)器、存儲、網(wǎng)絡(luò)組件、軟件和固件的數(shù)量以及它們的配置方式。
這些指標(biāo)與其他的指標(biāo)一起可以指示使用比率或計算占總數(shù)的百分比,如衡量服務(wù)器CPU使用率(0~100%)。百分比利用率給出了資源活動水平的相對情況,它本身并不能表示服務(wù)是如何被交付或受PCFE的影響的。例如一個服務(wù)器以50的利用率運行,可能會比85的利用率消耗更少的能量,然而,在85利用率下,應(yīng)用程序的響應(yīng)時間和性能可能以非線性的方式下降。服務(wù)器、存儲和網(wǎng)絡(luò)的性能通常會因為工作負(fù)載的增加而下降,由此可見響應(yīng)時間和延遲、IOPS或帶寬以及空間利用率的重要性。