亚洲成精品动漫久久精久,九九在线精品视频播放,黄色成人免费观看,三级成人影院,久碰久,四虎成人欧美精品在永久在线

掃一掃
關注微信公眾號

科技運營數據管理實踐
2023-11-01   匠心獨運維妙維效

  01引言

  隨著“十四五”規劃提出發展數字經濟,推動數字產業化和產業數字化轉型,各商業銀行正處于數字化轉型的深水區,在加速金融科技數字化、智能化、服務化的過程中,各領域都有原始的數據積累。以銀行金融科技運維為例,配置管理建立后數據使用價值不高,數據問題也愈積愈多,其核心問題是要同步做好數據管理,數據管理區別于上層的數據治理,更側重于具體方法、流程、機制和措施等。這里結合運維領域,具體說明進行數據管理的方法和實踐。

  02運維數據管理面臨的問題

  首先說明下對數據治理的理解,數據治理是專注于將數據作為商業資產進行應用和管理的一套機制,能消除數據的不一致性,建立規范的數據應用標準,提高組織的數據質量,實現廣泛應用和共享,發揮數據的商業價值。那么其具體的數據管理要解決什么問題呢?結合我們實際問題,總結有四個字“堵”,“獨”,“滯”,“漏”。這里以G行運維配置數據作為管理對象,對其他銀行科技領域數據管理有一定代表性。


圖1數據管理面臨的問題圖1數據管理面臨的問題

  03數據管理的“道”,“法”,“術”,“器”

  大家可能有疑問,解決以上問題建立數據中臺不是最好的解決方案嗎?有不少企業在數字化轉型過程中,數據管理完全依賴數據中臺建設,沒有搞清數據管理基礎要做什么,導致中臺也建成了空中樓閣。正如阿里的onedata方法論體系,是先建立一套數據標準,用統一建模的方法梳理整合數據,再利用數據中臺工具對數據進行匯總加工,因為有統一標準和建模,數據才能在中臺只實現一次順暢加工流轉。所以這里不談中臺建設,只說數據管理的具體思考和實踐。基于以上問題,我們結合DAMA的數據治理框架及方法論,制定了具體的數據管理方法,也引用數據治理專家們總結的數據管理的經驗,按“道”,“法”,“術”,“器”結合具體實踐工作,對運維數據管理遇到的問題有一定指導作用。


圖2數據管理的“道”,“法”,“術”,“器”圖2數據管理的“道”,“法”,“術”,“器”

  道

  (一)”道”:這里引用DAMA-DMBOK2的數據治理之道,主要包含數據戰略,組織機制和數據文化。如果數據治理好比我們驅車到達遠方的一項任務,那么“道“就是我們行駛的方向,以及可以利用的政策和可規避的風險。

  數據戰略好比數字化轉型的燈塔,由制度流程、組織人員和技術工具為數據戰略提供指導,數據戰略是為企業發展和運營目標提供支撐。通常制定為五個主要步驟:環境因素分析,確定戰略目標,制定行動方案,落實保障措施,戰略評估優化,其核心是建立數據思維。數據思維建立方法可通過自上而下的推動,營造數據驅動的文化氛圍,以及建立循序漸進的培訓機制等。不只是從企業做起,是需要從每個人做起,建立“我為人人,人人為我”的數據服務思維。G行數據治理總體框架包括“統一管理、合規底線、協同共建、創新驅動”四個方面。有三個要點:抓重點,善于簡化;求精確,注重量化;明不知,追求細化。

  法

  (二)“法”:主要是數據管理的一些方法和策略,好比我們驅車到達目的地的可選路徑,這些需要前期規劃好,結合流程確保管理策略能落地。

  G行主要分為事前預防手段,事中控制技術,事后改進措施。事前包括數據標準定義,校驗規范,流程制度優化,組織人員培訓保持認知一致;事中包括控制源頭,規范標準輸入輸出,控制流轉,質量校驗,精準定位,預警機制;事后包括數據質量探查和評估,數據問題匯總,根因分析,問題修復,流程和模型優化。這里最重要的是數據標準的制定、推廣和跟蹤,數據標準其實可以分為基礎數據標準,分析和校驗數據標準和實施標準,然后通過組織、制度和流程將其管理規范貫穿起來,通過流程和制度監督標準的執行,有效地閉環管理。我們也是首先統一并制定了數據標準,利用ITSM流程工具結合CMDB發現的問題,逐一溯源,消滅數據問題,形成閉環跟蹤,持續監督提高數據質量。

  術

  (三)“術”:這里指數據管理的一些技術方法,好比我們驅車到達目的地的駕駛經驗。

  主要涉及元數據,主數據和參考數據的一些管理技術,我們主要通過DAMA數據定義標準的學習,對系統運維領域的數據做了元數據和主數據的劃分。元數據可以理解為定義和描述其它數據的數據,包括技術和業務流程、數據規則和約束,還包括邏輯數據結構與物理數據結構等。主數據可以理解為與業務活動相關或提供業務活動語境,系統間共享的數據,包括業務交易中涉及的內外部對象的詳細信息。元數據就像我們數據庫中定義的基表結構,主數據是表里存儲共享的實際數據,或者好比元數據像一本書的目錄和索引,主數據就是書中的正文。很多金融企業的運維數據在前期都是按運維需求建立起來的,并沒有事先區分元數據與主數據,我們之前也是已經定義的運維相關的運營配置數據、運營性能數據和運營管理數據,所以管理過程主要在之前數據需求劃分的基礎上,再按元數據和主數據進行劃分,這樣劃分后的好處更有的放矢,更清晰我們的數據分類管理策略,更好地為我們的onedata數據中臺體系服務。我們對運維領域元數據和主數據是按以下過程進行管理:摸底、優化、標準、整合、運營。


圖3數據管理過程圖3數據管理過程

  大部分運維的配置類描述元數據都是未標準定義,或引用后再定義的,比如服務器硬件配置信息、操作系統信息、應用軟件信息、IP信息等。這些信息我們都是在CMDB收集時直接采集,往往沒有制定標準,在之后的消費過程就可能出現歧義、遺漏或無法關聯等問題。元數據就是數據標準的基礎,企業在制定數據標準的時候最先需要明確的就是數據業務屬性、技術屬性和管理屬性,而這三類屬性就是我們所說的業務元數據、技術元數據和管理元數據,元數據如果不進行規范化約束,就無法成為數據標準。我們針對元數據的梳理主要是分類了業務、技術和管理三類,并制定了配置數據管理標準規范,具體有三項措施:

  1.梳理出關鍵數據,將這些數據做埋點,以便后續進行數據血緣跟蹤和分析;

  2.統一表結構,將各類數據表形成統一結構規范,層級管理,比如第一層基本信息,第二層關聯信息,第三層特殊信息;

  3.統一字段名規范,建立數據字典統一命名規范,再確定各個表來源和優先級。

  這些措施保障了理解數據準確和標準的一致性,并提供統一訪問途徑,以便推廣技術元數據標準和應用。在主數據管理方面,主要是按元數據定義的標準,對數據值和標識符進行控制和校驗,經過管理的主數據應是關鍵業務實體唯一的、權威的、最準確的數據,更方便數據共享。在主數據規范管理后,我們更多關注系統之間的數據流轉、訪問關系、共享應用等,更多地挖掘運維消費場景,實現數據服務。

  器

  (四)“器”:是在數據管理技術的基礎上,實現具體工作的工具,好比我們驅車到達目的地的主要交通工具。所謂“工欲善其事,必先利其器”,在定義梳理這些元數據和主數據后,必然會用到兩個最常用的方法工具,建立模型和數據血緣。數據建模是最重要也是最常用的,是發現、分析和確定數據需求的過程,用數據模型的精確形式表示和傳遞這些數據需求。建立系統或平臺前期一般都會建立數據模型,其模型核心內容是數據結構、約束關系和數據操作這三部分,形成概念、邏輯和物理模型成果物,但建立和維護的過程是循環迭代的。我們按照以前CMDB系統建立的模型,進行了重新梳理,發現有一些數據結構已經過期需要優化調整,還有一些一直存在缺失,需補充數據結構,也同步更新了約束關系和數據流向的定義,具體是按以下六個方面進行全面梳理:


圖4數據建模工作圖4數據建模工作

  數據建模工作我們是這樣具體實施的:關于數據結構,重新收集數據有關需求,定義數據類型、結構等信息,實現配置項結構、字典(具體元數據)的建立;約束關系,梳理各團隊內部數據,定義數據的唯一標識符,確定數據間關聯約束和驗證關系;數據操作:協商定義各運維團隊之間的接口規范和數據流向,明確數據操作和流向的消費場景。除了數據模型的三個核心內容外,我們還制定了接口傳輸方式,同步周期和接口負責人。首先根據數據量大小、重要程度以及數據時效性等要求,規范定義不同的接口同步方式,再次明確各運維團隊接口數據采集和同步周期,保證提供接口數據的完整和時效性,最終指定接口負責人溝通同步需求,確認接口數據質量,由負責人跟蹤推進接口同步實現和問題解決,實現數據問題閉環處理。

  04應用實踐

  (一)具體應用場景:

  G行通過系統運維配置管理平臺(SMDB)和網絡安全自動化合規管理平臺(INS)實現基于底層的配置數據管理,通過應用配置管理平臺(AMDB)實現應用路書、系統交易信息和檔案管理等應用場景管理,為CMDB提供數據消費,規范數據標準,整合數據需求,去重尋源等優化,增加數據校驗,實現閉環管理。通過平臺,結合數據采集匯總分析,以及相關操作工具,實現日常運維配置管理、系統自動巡檢、系統檔案和運維報表等運維自動化消費場景。


圖5數據應用場景圖5數據應用場景


圖6配置管理圖6配置管理


圖7運維消費場景圖7運維消費場景

  此外我們還結合數據血緣流向圖,提供多平臺互聯的消費場景。在運維環境隨著云計算和大數據的發展,集成化程度越來越高,系統全局性風險的可能和危害越來越大,我們利用梳理的數據流向,和日常故障處理場景,重點為一線團隊開發應急故障查詢和應急場景發布工具。一線同事在處理全局性故障時,能及時準確地查詢相關信息并第一時間關聯處置,實現運維的“手眼”并用。


圖8數據服務輸出成果圖8數據服務輸出成果

  (二)解決數據問題:

  針對已經建立的CMDB,我們如何梳理存在的數據問題呢?我們主要從兩個方面進行梳理檢查:一是日常事件處理、問題分析等發現的數據問題,統一記錄、分析和整改跟蹤;二是通過數據模型的度量指標進行反向檢查:1.模型多大程度上反映了實際使用需求?2.模型的完整性如何?3.模型的結構通用性如何?4.模型遵循命名標準的情況如何?5.模型的清晰、完整、準確性如何?基于以上自查不難發現數據模型的問題,可以重新定義、梳理和規范數據模型,數據模型是數據規范標準的核心底座,是絕對值得花費精力打造優化的。

  其實解決數據問題更多要源于數據訴求,對數據流向的管理無論從業務還是運維管理都已經變得非常重要。通過數據血緣分析能滿足元數據管理的需求,滿足監管需求,影響分析和數據質量問題分析等,針對運維最有效的還可以系統遷移時參考數據血緣,減少系統遷移工作量。通常建立數據血緣的步驟是先梳理出元數據之間的關聯關系建立模型,再以此為基礎整理所需的數據,并將數據加載進數據庫,設計關系進行鏈路匹配查詢分析,我們主要針對CMDB的數據進行反向步驟的梳理,重點結合目前數據和應用場景,抽取數據流向和關系,再根據關系檢查驗證以前的模型,對錯誤和遺漏的問題進行修正和補充。

  比如我們梳理的數據血緣關系,制作了以下數據流向圖,便于梳理和解決數據問題,具體包含以下內容:


圖9數據流向圖圖9數據流向圖

  1.數據節點(包括數據流入節點,主節點,數據流出節點),數據節點信息一般用來做可視化展示。

  2.數據流轉線路,數據流轉線路表現三個維度的信息,分別是方向、唯一標識、數據更新頻次。

  3.清洗過濾規則,數據接受方會根據自己對數據的要求過濾接入的數據,這些要求就形成數據標準,依據這些標準選擇數據清洗。

  4.轉換和關聯規則,從數據提供方出來的數據,有時需要特殊處理才能接入到數據需求方,按唯一標識建立關聯并維持生命周期,到期后需要做歸檔或清除等處理。我們設計的血緣關系,能較清晰地表達數據間關聯關系,對組織數據的完整性、準確性管理和溯源分析有一定幫助。

  通過數據流向的血緣分析還可以糾偏數據和挖掘更多的應用場景。方法通常有:自動解析,系統跟蹤,手工收集和機器學習等,我們主要使用的是自動解析結合手工收集,重點排查CMDB平臺原有的SQL語句和存儲過程,找出核心數據的來源和目標流向,這些數據覆蓋約70%的流向關系,我們也按重點、熱點數據進行收集,梳理過程主要還靠人員整理,雖然比較繁瑣,但是最大的好處是更加明確數據流向和應用場景。還有一些數據是基于流程或手工更新的,我們采用手工收集方式,這些數據要確定好唯一數據源,能優化流程的盡量自動化處理,必須手工處理的增加校驗機制來確保及時性和準確性。

  05總結展望

  以上是我們結合數據管理方法,針對運維數據的一些管理實踐。“在危機中育新機,于變局中開新局”,“十四五”規劃提出發展數字經濟,G行也積極推進數字化轉型工作,實現科技為業務賦能,運維數據管理工作就是我們要重點開拓的新局。數據管理實踐是一項有既有挑戰又有意義的工作,而且需要不斷持續優化,它即是一門科學,更是一門藝術,我們要深入學習以上“道”,“法”,“術”,“器”的方法論,再結合工作中的具體場景,不斷深耕實踐,讓運維之手和運維之眼有數可依,更加高效、從容地實現自動化、智能化運維,全面實現科技賦能。我們將踔厲奮發、篤行不怠,持續推動數字化轉型工作更上一層樓,把一流財富管理銀行推向前進!

熱詞搜索:數據管理

上一篇:如何充分利用數據可視化
下一篇:最后一頁

分享到: 收藏