當前有很多企業,迫于優化IT環境成本及企業效率的需要,急需更有效的方式用以管理和維護跨多個數據源的數據。同時,日益增加的公司治理費用,運營風險和法規制度,也迫使企業更加重視核心數據的管理。特別是近年來,隨著社交媒體的發展,為應對來自社交數據、大數據及云數據管理提出了挑戰,企業對開始將主數據管理(MDM,Master data Management)應用于企業中。
Gartner曾經過在近期做過一次調查,2012年全球主數據管理軟件的銷量將達到19億美元,較2011年增長21%。在未來5年里,主數據管理軟件的銷量將繼續強勁增長,在2015年達到32億美元。
不過,Gartner同時也指出,當前主數據管理的需求仍然是北美和歐洲地區最大,這兩個區域的MDM軟件銷量將穩步增長,并分別于2013年和2015年達到10億美元大關。在2013年,MDM軟件收入將在亞洲/太平洋地區實現較快增長,收入將較2012年增長30%,至2.09億美元。
主數據的定義
從Gartner的調查數據,我們發現國內對于主數據管理的價值還有待進一步提高。在這里,編者先大致地介紹一下主數據的定義。對于主數據的定義有很多不同的定義,綜合起來可以定義為:企業內能夠跨業務重復使用、并且需要共享的高價值數據。
那么,具體哪些數據才是主數據呢?例如,客戶、供應商、帳戶、組織單位、員工、合作伙伴、位置信息等都是主數據,而大部分的交易數據、帳單數據等都不是主數據。并且,有業界專家指出,主數據是企業的核心數據,是企業最權威、一致的一系列標識、擴展屬和層次關系,它在企業運營中擔當著關鍵角色的數據實體。
同時,企業有些人會將元數據和主數據混問一談。實際上,主數據和元數據是兩個完全不同的概念。元數據是指表示數據的相關信息,比如數據定義等,而主數據是指實例數據,比如產品目錄信息等。
主數據面臨的難題
那么,當前企業的主數據正面臨著什么樣的難題呢?具體來說,主要有四個方面,其中包括主數據的定義、流程、質量和共享等難題。
1、在定義方面,沒有統一的標準、沒有明確的定義和范圍。
2、在流程方面,數據創建、維護等管理流程不一致。
3、在質量方面,數據缺乏完整性、一致性、準確性,重復數據多,也導致主數據管理難。
4、在共享方面,不知以誰為"主"、共享途徑不暢及訪問控制困難等問題也讓主數據共享產生困難。
而且,這些問題的本質往往是因為多點維護以及缺乏信任規則造成的。精明的IT決策者們正在想方設法尋找技術來解決上述問題,而MDM就是恰當之選。MDM是一系列的工具和處理過程,確保企業主數據的高質量、統一定義和流通便利性,這就正好把主數據所面臨的定義、流程、質量和共享等四大難題給一一解決了。
主數據管理的三大要素
既然我們已經非常清楚主數據面臨的難題是什么,那么企業的主數據應該如何管理呢?主數據管理通過三大要素的處理,包括主數據模型、主數據整合手段和主數據服務等,幫助企業解決主數據面臨的四大難題。
首先,確定主數據模型。企業需要確定機構主數據的范圍,然后才是確定機構數據模型和標準,但幾乎沒有拿來就能用的模型,往往需要根據不同機構的業務需求來定義模型,所以主數據管理的定制能力很重要,需要支持模型的靈活定義,特別是對未來更多類型主數據的支持。
其次,確認主數據整合手段。在主數據的整合過程中,企業要選擇的是采用哪種模式進行整合。
一般情況下,整合手段有四種模式:第一種是注冊模式,適用于標示單一的客戶、病人、產品等;第二種是合并模式,用于支持DI/DW 報表和分析要求,以及法規遵從等;第三種是共存模式,面向銷售、市場、客戶服務支持操作型要求等;第四種是集中模式或交易模式,它同時支持分析型、操作型的需求等。不過,這四種模式并不是獨立存在的,往往是多種模式的一個組合,最后,通過SOA服務方式,將主數據管理信息服務化,供不同應用使用。
第三是,配置主數據服務。配置主數據服務是主數據管理的關鍵環節。其中,重復數據識別是主數據管理中的重要能力,根據配置的規則,標示在多個系統中存在的潛在的匹配對象,根據閾值定義,確定是否匹配,將有疑似的匹配結果,通過業務流程提交人工確認。另外,需要特別說明的是數據間的層次關系,它可以幫助企業全方位了解信息,其關鍵要素包括,跨系統、跨應用能力;為不同的商業目的, 創建、管理多種不同的層次關系;關聯不同的實體,構建360度視圖,并且可以保持所有實體關系歷史。
同時,我們發現,主數據的管理常常被誤解為是個單純的數據標準問題,而實際上在企業內部貫徹實施統一的標準需要愿景、制度、IT等全方位的配合,也就是說,主數據管理實質上是個管理問題。所以,為主數據管理而建立的獨立信息平臺,最好由業務方面的高層來負責,而不是IT部門負責人,因為,很多時候并不是技術的問題,而是業務部門之間的協調。
主數據管理與數據倉庫的區別
有企業用戶發出疑問,企業剛剛部署了數據倉庫,是否可以此基礎上進行主數據管理?這兩者有什么區別呢?
事實上,數據倉庫系統的分析結果可以作為衍生數據輸入到 MDM 系統。我們可以從目的、處理方式和數據量等三個方面來區分主數據和數據倉庫的區別。
主數據是經常需要維護的,需要確保其時效性和準確性。
首先,兩者的目的不同。主數據管理的目的是導出絕對真實的核心數據,即關鍵業務數據,同時還得提供主數據之間的關聯性,而這在數據倉庫里是難以找到的。
其次,兩者的處理方式上不同。主數據管理是一種偏交易型的系統,系統的服務對象是呼叫中心、B2C、CRM等業務系統;而數據倉庫是屬于分析型的系統,面向的是分析型的應用,在大量歷史交易數據的基礎上進行多維分析。
最后,兩者的數據量上不同。主數據管理存儲的僅僅是客戶和產品等核心數據的信息;而數據倉庫存儲的是來自歷史數據和各個維度的匯總數據,可能是海量數據。
盡管主數據管理牽涉到多個業務系統的數據平臺,可以與CRM以及ERP系統進行集成在一起協同工作。不過,主數據管理最好是一個獨立的企業級信息平臺,可以統一管理企業主數據。一個主數據管理解決方案不僅僅是一個軟件平臺,往往還包括一系列的最佳實踐和方法,一些相關的業務團隊以及特定的數據處理功能。
原文鏈接:http://server.zol.com.cn/277/2772467.html