獨立企業數據集成軟件提供商Informatica公司近日推出了Informatica PowerCenter Big Data Edition。這是一項重要的革新,使企業能夠高速、大量、多種類地將社交、移動設備、云以及機器中的數據增加到傳統交易數據中。使用Hadoop等新型分析平臺,PowerCenter Big Data Edition是唯一將新興技術與傳統數據管理基礎設施相結合,在充分釋放大數據價值的同時降低大數據成本和風險的產品。
PowerCenter Big Data Edition提供了一個創新且無需編碼的環境,確保企業圍繞諸如Hadoop等新型技術,通過以下方面降低大數據項目的成本:
•高速數據存入和提取——跨異構環境進行大數據加載、處理和提取,以優化Hadoop和傳統數據管理基礎設施間的端到端的數據流。
•無編碼開發環境——使用Informatica可視化開發環境去除Hadoop中的手工編碼。開發和測量數據流而無需專門的手工編碼,以最大限度提高重用率。
•虛擬數據機——允許用戶一次建立轉換邏輯,在Hadoop、傳統ETL網格基礎設施甚至數據聯合應用上任意部署。開發者可在虛擬數據機上只創建一個單一的圖形映射集,且將他們運行在多種數據平臺和部署模型上。
•在Hadoop上近乎通用的數據訪問和全面地提取、轉換和加載(ETL)——使用一個豐富的、預建的ETL庫可靠地訪問多種類型和來源的數據,對運行在Hadoop或傳統網格基礎設施上的交易和交互數據進行轉換。
Informatica公司執行副總裁兼首席技術官James Markarian說:“PowerCenter Big Data Edition為用戶提供了一種業經驗證的創新方法,這種方法是建立在Informatica基于GUI(圖形用戶界面)的開發環境和Informatica在數據集成領域長期領導地位的基礎之上的。早期的Hadoop使用者開始意識到,由于缺乏與傳統計算和數據管理基礎設施的互操作性而遇到的困難,以及效率低下、在其他編程語言技能方面欠缺的問題。PowerCenter Big Data Edition可以解決所有這些問題:近乎通用的連通性和無編碼開發。簡而言之,我們對大數據和Hadoop的價值主張是:安全采用Hadoop等新技術,使用已有技能和基礎設施,實現更多功能。”
Gartner 2011年9月題為《21世紀的信息管理》的報告中稱:“到2015年,那些將高價值、多種新信息類型和來源整合到統一信息管理架構中的企業,將實現比業內同行優于20%以上的財務表現。”
最大限度減少新技術風險
實施所有新技術,例如Hadoop,會引起一定的實施風險。PowerCenter Big Data Edition通過提供以下特點幫助企業將這些風險最小化:
•將新興技術與傳統數據管理基礎設施相結合的投資,從而對未來執行大數據策略提供防護。
•采用經數十萬集成項目驗證的Informatica數據集成平臺,創建可擴展的Hadoop任務。
•直接對Hadoop進行數據探查,提高大數據分析結果的可信度,以便盡早發現數據質量問題并對大數據分析進行驗證。
•通過無縫轉移、靈活還原、連接恢復實現關鍵任務的高可用性。
•數千名訓練有素的Informatica系統集成商合作伙伴專家,隨時待命。
減少大數據成本
數據量持續不斷地成倍增長,且復雜性也不斷增加,這一趨勢永遠不會停止。PowerCenter Big Data Edition能夠幫助企業減少大數據管理成本,用戶可以:
•基于數據量、數據類型和潛在需求將大數據集成處理部署在最具成本效益、最高性能表現的處理資源上。
•通過向一個無代碼的開發環境遷移,可以將數據集成開發效率提高多達三倍。
•在Hadoop上采用預構建數據轉換庫以減輕開發工作量并提高開發質量。
•使用已有的PowerCenter技能進行大數據開發。
上市時間
PowerCenter Big Data Edition約在2012年12月發布。