云計算已經成熟,正迅速與新時代的參與者如亞馬遜、谷歌和Salesfore.com一起向更多既定的 IT供應商進軍。為了不被淘汰,Kognitio正在通過英國的服務供應商2e2來大力提升數據倉庫,以此作為一項服務(DAAS)。術語之間的戰爭仍在 進行。GreenPlum公司吹捧它在福克斯互動媒體(FIM)的企業數據云(EDC)倉庫平臺,稱其有高度分布式數據倉庫,鞏固了點擊流處理和社交分析 網絡(例如MySpace)。就其本身而言,Aster Data Systems公司利用谷歌的MapReduce功能和Gartner公司對它的評論,使其“前線數據倉庫”成為品牌產品,因此提供了可信度和贊賞的聲 音。
數據云
在一個完全獨立的領域,數據云將對醫療保健和公共領域產生重大的意義。國家衛生信息網絡(NHIN)主 要依賴于由付款人、供應商和管理人員構成的健康信息交換的關鍵路徑。這是一個重要的用例,其數據高度分散、計算密集,并且在關鍵路徑上建立電子醫療記錄 (EMR)和醫療保健分析以支持業績進行評定。不過,云基礎設施最終將作為企業之間重要的功能區分。
數據倉庫的提示和建議:不要混淆了工具與加速器。工具可取代數據集市或數據倉庫;加速器被安裝在現有的 系統上,它是不會消失的。后者獲得了SAP的商業倉庫系統的后端緩存頻繁執行的資源密集型的查詢牽引。Oracle RAC似乎也受益于加速器的傾向。
基于列的數據庫幾乎可以自負盈虧。根據該方案。因為基于列的數據庫在本質上縮減了保存數據的所需要的空 間大小,因此組織可以大大節省存儲開銷。這可在應用先前的壓縮算法之前發生。需要注意的是,由于您的具體情況可能會有所不同,所以還是需要引起注意。此 外,幾乎沒有企業會讓他們的絡網中心處于一種輻射型結構。不過,從性價比的上漲幅度上可以看出一些供應商(例如,ParAccel2009年6月21日基 準[www.tpc.org])向工具方面和標準關系型數據倉庫方面發展。
如果你正在考慮用一個數據倉庫工具執行已經準備好了的估價。如果你的公司只有有限的技術經驗(或者沒 有),就得做好充分的準備工作。說出關于公司使用新新技術的能力的真實情況。新技術往往產生新的角色和職責。性能創新能夠使業務處理流程有新的進展。該技 術集成,人員和流程需要計劃,或者獲取和安裝“貨架軟件”的風險成為現實。這適用于與任何新技術相結合。
該中心輻射型架構仍然是最靈活的。數據集成的一般原則是通過減少系統接口的數量來盡量減少成本,以支持 和維護。點對點是最沒有效率的。在這種情況下,基于列的分析型數據庫和工具將成為整個網絡的節點,而不是中心,這在企業數據倉庫在標準關系數據庫方面仍然 是至關重要的。
通過相同的數據集市處理程序來管理基于列的型數據庫和數據倉庫工具。盡管分析型數據庫(例如 ParAccel)提供了高可用性的功能,因為分析應用程序始終具有至關重要的使命,服務水平協定仍然沒有嚴格執行你的業務的交易系統。
各個擊破。處理大量數據,經過驗證的可擴展性的路徑在于通過并行處理-每一個多線程服務器都有一個自己 的存儲器與高性能網絡連接,這就好像作為一個單一系統呈現給最終用戶。其他創新是在數據存儲器地址空間里達到了較大的數據緩存。他們將減少或消除磁盤的寫 入與輸出,還有異步事務,但事務處理對存儲區域網絡進行嚴格地寫入操作。
云計算和相關的“數據云”適合分布式數據和分布式企業。創業和那些喜歡研究樣機的人也將受益于云模型。 云計算把軟件看作是一種服務(SAAS),網格計算和虛擬化達到了一個新水平,提取支持計算資源的零售的整個數據中心所實現的接口。 在許多情況下,這是不恰當的。最終,數據云將在跨部門、分散式的企業內部變得至關重要。