2012年5月21日 ,全球領(lǐng)先的獨立企業(yè)數(shù)據(jù)集成軟件提供商Informatica公司(納斯達克代碼:INFA)近日宣布了Informatica 9.5的多項進展,使得Hadoop成為企業(yè)級之選。
通過交互性、生產(chǎn)力及可管理性,Informatica 9.5提供全新及擴展功能,釋放了Hadoop的潛能,使用戶能夠提高大數(shù)據(jù)的投資回報:
· 通過數(shù)據(jù)接入拓展了其交互性,包括社交媒體數(shù)據(jù),并且可將其通過批量或?qū)崟r的方式導入Hadoop。
· 通過在Informatica中利用圖形數(shù)據(jù)設(shè)計數(shù)據(jù)集成任務及流程,提高了生產(chǎn)力,并且可將設(shè)計直接部署在Hadoop中進行自主執(zhí)行。
· 借助通用數(shù)據(jù)整合平臺,提高了所有企業(yè)數(shù)據(jù)的可管理性,包括Hadoop中的數(shù)據(jù)。
Informatica首席技術(shù)官 James Markarian表示:“在IT環(huán)境中,Hadoop不可能作為一個孤島存在。為了讓Hadoop可以跨越不同平臺并成為一種主流技術(shù),用戶需要將Hadoop作為他們IT大環(huán)境中的一部分來管理,通過Hadoop重復使用他們的開發(fā)技巧、資產(chǎn)及數(shù)據(jù),并統(tǒng)籌管理全部數(shù)據(jù)。Informatica 9.5 為企業(yè)帶來了他們所需的交互性、生產(chǎn)力以及可管理性,以便快速采用Hadoop并最大化他們的大數(shù)據(jù)投資回報。”
通過訪問社交數(shù)據(jù)以擴展交互性,帶來對Hadoop近乎實時的管理
鑒于社交計算繼續(xù)急速增長的步伐,許多企業(yè)正在轉(zhuǎn)向利用社交數(shù)據(jù),從而更加清晰地洞悉用戶及市場。Informatica 9.5 帶來了擴展的社交數(shù)據(jù)集成功能,以幫助獲取社交數(shù)據(jù),并且可以以批量、數(shù)據(jù)流或者復制的方式將數(shù)據(jù)按任意延遲速度導入Hadoop中。新功能包括:
· 對社交數(shù)據(jù)更好的連接性:Informatica 9.5可提供對Twitter數(shù)據(jù)流的支持,以及一個數(shù)據(jù)流API支持RSS、ATOM或其它網(wǎng)頁來源協(xié)議。
· 近乎實時的數(shù)據(jù)復制至Hadoop:Informatica 9.5 提供了Informatica 快速克隆及數(shù)據(jù)復制HDFS支持功能,以大量快照及近乎實時數(shù)據(jù)復制的方式將數(shù)據(jù)導入Hadoop。
通過在Informatica中進行設(shè)計并在Hadoop中自主運行,提高生產(chǎn)力
借助通用數(shù)據(jù)整合平臺,Informatica 9.5進一步提高了企業(yè)集成并管理全部數(shù)據(jù)的能力,其核心在于通過在Informatica HParser中設(shè)計數(shù)據(jù)整合關(guān)鍵任務,然后在Hadoop中進行自主運行而無需編寫代碼。
為實現(xiàn)這個目標,針對大數(shù)據(jù)分析,Informatica 9.5 為Informatica HParser加入了增強的性能,包括:
· 通過Protobuf,為數(shù)據(jù)交互及系列格式提供拓展支持:借助Informatica 9.5,用戶現(xiàn)在可以自主地進行Google Protobuf分析,并且通過Informatica HParser在Hadoop上進行轉(zhuǎn)換。
在七月即將發(fā)布的Hadoop beta版本中,更多新的Hadoop-native功能可以帶來更高的生產(chǎn)力,正式版本計劃在2012年第四季度發(fā)布:
· 針對數(shù)據(jù)恢復、數(shù)據(jù)集成以及數(shù)據(jù)清洗的Native Hadoop支持。
· Hadoop自然語言處理(NLP) 功能提供了強大的社交數(shù)據(jù)處理及分析能力。
· Hadoop中的社交數(shù)據(jù)識別及處理功能可將對象相互關(guān)聯(lián)并豐富主數(shù)據(jù)。
利用通用數(shù)據(jù)集成平臺,提升所有數(shù)據(jù)的可管理性
如果沒有企業(yè)級的管理功能,企業(yè)無法從Hadoop上獲得全部收益。Informatica 9.5 為Hadoop帶來了Informatica 的可管理性優(yōu)勢,包括:
· 針對Hadoop的基于策略的數(shù)據(jù)歸檔,可降低存儲以及法規(guī)遵循的成本,并且通過豐富的企業(yè)歷史信息帶來新的洞察力。
· 對開發(fā)、部署、監(jiān)控及管理Hadoop和非Hadoop任務提供混合負載支持,建立一個復合IT環(huán)境,該功能會在beta版本中出現(xiàn)。