研究機構IDC預言,大數(shù)據(jù)將按照每年60%的比率增加,其中包含結構化和非結構化數(shù)據(jù)。企業(yè)需要想辦法發(fā)揮這些數(shù)據(jù)的作用,而長期以來數(shù)據(jù)庫就是一個非常好的解決方案。目前服務提供商正通過云技術推出更多可在公有云中托管這些數(shù)據(jù)庫的方法,將用戶從繁瑣的數(shù)據(jù)庫硬件定制中解放出來,同時讓用戶擁有數(shù)據(jù)庫擴展能力。研究公司W(wǎng)ikibon的大數(shù)據(jù)研究專家Jeff Kelly說:“這是一個非常大的市場。云將是許多大數(shù)據(jù)的最終目的地。”
當然在DBaaS(數(shù)據(jù)庫即服務)中仍然存在著許多問題,尤其是關于存儲在云上的敏感信息,以及云服務中斷等問題。不過,云數(shù)據(jù)庫和工具這一新興市場明顯在加速發(fā)展。以下是美國《Network World》所關注的10個云數(shù)據(jù)庫工具。其中一些是直接關系型數(shù)據(jù)庫、SQL或者NoSQL數(shù)據(jù)庫提供商,還有一些則將重點放在了開源數(shù)據(jù)庫上。當然這里列出的10個云數(shù)據(jù)庫不可能面面俱到,像甲骨文、惠普以及EMC/VMware這些大型的市場參與者也已經(jīng)推出了他們各自基于云的產(chǎn)品,以及針對這些工具的策略。
1.亞馬遜Web服務(AWS)
亞馬遜Web服務(AWS)擁有多種基于云的數(shù)據(jù)庫服務,包括關系型數(shù)據(jù)庫和非關系型數(shù)據(jù)庫。亞馬遜關系型數(shù)據(jù)庫(RDS)能夠運行MySQL、甲骨文以及SQL Server等多種實例,而亞馬遜簡單數(shù)據(jù)庫(Amazon SimpleDB)則是一種專門針對小工作負載的非模式化數(shù)據(jù)庫。在NoSQL方面,Amazon DynamoDB是一種支持固態(tài)硬盤的數(shù)據(jù)庫,它能夠自動在至少3個可用空間中復制工作負載。亞馬遜Web服務的CTO Wemer Vogles表示,DynamoDB是亞馬遜Web服務歷史上增速最快的服務。此外,亞馬遜還發(fā)布了一些輔助的數(shù)據(jù)管理服務,例如最新發(fā)布的Redshift數(shù)據(jù)倉庫,以及能夠幫助用戶整合多來源數(shù)據(jù)以方便管理的Data Pipeline。
2.EnterpriseDB
EnterpriseDB將重點放在了開源的PostgreSQL數(shù)據(jù)庫上,不過讓它名聲鵲起的原因卻是其與甲骨文數(shù)據(jù)庫應用協(xié)同工作的能力。通過使用EnterpriseDB的Postgres Plus Advance Server,用戶可以通過EnterpriseDB的使用為本地甲骨文數(shù)據(jù)庫編寫的應用。目前EnterpriseDB已能夠在惠普和亞馬遜Web服務的云服務上運行。此外,EnterpriseDB還具備二元復制及定期備份等功能。
3.Garantia Data
Garantia為用戶提供了一個網(wǎng)關服務,通過這個服務,用戶可以在亞馬遜Web服務公有云上運行開源的Redis和Memcached內存非關系數(shù)據(jù)庫服務。Garantia軟件可以幫助開發(fā)者為這些開源數(shù)據(jù)平臺自動擴展節(jié)點,創(chuàng)建集群以及容錯模型。
4.谷歌Cloud SQL
谷歌的云數(shù)據(jù)庫服務主要集中在谷歌Cloud SQL和BigQuery這兩大產(chǎn)品上。前者被谷歌描述了一種類似MySQL的完全關系型數(shù)據(jù)庫基礎設施,而BigQuery則被塑造成在谷歌的云基礎設施上運行大數(shù)據(jù)集查詢的分析工具。
5.微軟Azure
微軟利用其SQL Server技術研發(fā)了一個關系型數(shù)據(jù)庫,允許用戶直接訪問云中SQL數(shù)據(jù)庫,或者在虛擬主機中托管SQL服務器實例。微軟對混合型數(shù)據(jù)庫也非常關注,該公司使用SQL Data Sync整合了用戶本地及Azure云上的數(shù)據(jù)。微軟還擁有一個名為Tables的服務,這一基于云的NoSQL數(shù)據(jù)庫服務采用了Blobs(二進制大對象存儲)算法,并專門針對視頻和音頻等媒體文件進行了優(yōu)化。
6.MongoLab
在NoSQL的世界中,有各種各樣的數(shù)據(jù)庫平臺可以選擇,其中包括MongoDB。MongoLab允許用戶通過亞馬遜Web服務、微軟Azure和Joyent等大型云服務提供商訪問MongoDB。與其他網(wǎng)關類型服務一樣,MongoLab同樣在應用層整合了多種PaaS(平臺即服務)工具。MongoLab既可以在共享的環(huán)境中訪問,也可以在專用的環(huán)境中運行,不過后者的開銷通常比前者稍大一些。
7.Rackspace
通過名為“Cloud Databases”的產(chǎn)品,Rackspace的數(shù)據(jù)庫既可以成為一個云,也可以成為一個托管服務解決方案。Rackspace將重點放在了Cloud Databases基于容器的虛擬化上,他們認為這將賦予數(shù)據(jù)庫服務遠甚于基于純虛擬化基礎設施的性能。Cloud Databases還以OpenStack平臺為基礎整合了一個SAN網(wǎng)絡存儲。Rackspace在近期還在其云服務上發(fā)布一個由服務提供商Cloudant研發(fā)的NoSQL數(shù)據(jù)庫。
8.SAP
企業(yè)軟件巨頭SAP目前正在通過基于內存技術的平臺HANA進軍云計算市場。來自HANA的云數(shù)據(jù)庫與Sybase等其他本地數(shù)據(jù)庫工具形成了互補。目前該數(shù)據(jù)庫已經(jīng)能夠在亞馬遜Web服務的云服務中使用。HANA同時還包括了其他非數(shù)據(jù)庫應用,例如商業(yè)管理工具和應用開發(fā)工具。
9.StormDB
不同于其他的云數(shù)據(jù)庫,StormDB是在實體服務器中運行其分布的關系型數(shù)據(jù)庫,這意味著沒有虛擬主機的存在。StormDB的官員指出,這樣可以帶來更好的性能和更簡易的管理,因為用戶不需要去給他們的數(shù)據(jù)庫選擇虛擬主機的容量。然而即使使用的是實體服務器,用戶還是在共享使用集群中的服務器。不過StormDB承諾,所有用戶的數(shù)據(jù)庫都是獨立的。此外,StormDB還能夠在云中對數(shù)據(jù)庫進行自動分片。目前該公司正在運行一個免費的測試版。
10.Xeround
Xeround是一個可以橫跨多個云供應商及平臺去部署可擴展MySQL數(shù)據(jù)庫的管理工具。Xeround提供了很高的可訪問性和擴展性,不僅能夠橫跨亞馬遜Web服務、Rackspace、Joyent、惠普等不同云供應商,還能夠在OpenStack和思杰(Citrix)平臺上工作。