云原生是企業采用云技術促進數字化轉型的關鍵原則之一。隨著容器、Kubernetes的部署不斷增加和云采用的不斷深入,特別是混合云的部署,開發人員的認知負擔越來越重。基礎設施環境日益復雜且難以管理,無法滿足產品或軟件開發團隊、人工智能(AI)/機器學習(ML)工程師(ModelOps)或提示工程師對敏捷的需求,例如可擴展性、靈活性以及對標準和操作流程、合規和安全要求的環境變化的適應性。基礎設施平臺工程被視為一門新學科,它的出現是為了應對系統設計和底層混合基礎設施日益增加的復雜性。在所有注重改善開發人員體驗的云原生開發模式中,這是一種尤為有效的方法。
盡管基礎設施平臺工程被定義為一種有效的實踐,可幫助基礎設施和運營(I&O)領導者從平臺角度更高效地管理底層混合基礎設施和運營,但傳統的I&O部門和I&O領導者仍面臨挑戰。I&O領導者可采用以下三個關鍵成功因素(見圖1)以確保基礎設施平臺滿足企業機構需求,并反映最終用戶的優先事項。
圖1:利用基礎設施平臺工程管理云原生平臺的三個關鍵成功因素
將基礎設施平臺工程原則與基礎設施用戶的需求相對應
Gartner將平臺定義為“一種可服務或賦能其他產品與服務的產品”。平臺的范圍應反映最終用戶的需求,對任何平臺的衡量最終都是以其為滿足最終用戶(例如開發人員或產品團隊)以及整個企業的重要需求做出的貢獻程度為標準的。這一標準同樣適用于作為I&O和業務線關鍵基礎設施平臺其一的云原生平臺。
多數大型企業都將云原生基礎設施引入了云原生平臺建設,尤其是在擴展到混合云環境時。然而,傳統的云原生平臺管理方式更多是以架構和領導力驅動,而并非由開發人員的開發體驗和數字生產力驅動。
根據混合云中的云原生平臺目標,優先納入基礎設施平臺工程原則。企業將關鍵基礎設施平臺工程原則集成到混合云中的云原生平臺中,這些原則與特定的用戶需求目標相一致,具體如下:
- 自助服務體驗
- 明確統一的應用編程接口(API)
- 可預測的可用性和性能
- 可共享
- 可觀測性
- 默認保護
- “既定路線”統一方針
- 產品管理
- 模塊化
文檔可復用
采用以產品為導向的管理方法
當云原生被認定為是多數大型企業采用云技術的關鍵原則時,越來越多的內部開發團隊開始向云原生應用架構轉型(如微服務架構、服務網格)。這種云原生應用架構要求底層基礎設施和平臺具備前所未有的可擴展性、靈活性和可編程性,從而縮短部署時間并提高可擴展性,更好地支持數字化轉型。
然而,當企業擴展到混合云并高度依賴Kubernetes時,平臺工程團隊就面臨著架構挑戰和(來自產品或開發團隊)對于混合云場景的復雜需求。傳統的管理方式使管理復雜需求和底層的復雜基礎設施成為挑戰。以產品為導向的管理方法是云原生平臺成功擴展到混合云的關鍵。
與傳統的開發和運營實踐相比,敏捷交付實踐的生產率更高,能交付更高質量的數字產品,并能更穩定地滿足客戶需求。
明確角色和職責
基礎設施平臺工程團隊可以利用部署組件的內置設計特性來實現產品團隊或開發人員所需的關鍵可復用功能。對于建立合理的自主性和提高開發人員生產率來說,明確界定平臺和產品團隊之間的職責分工非常重要。
基礎設施平臺工程團隊的管理職責和云原生平臺的常見功能如圖2所示。
圖2:支持云原生平臺的基礎設施平臺團隊的管理職責