想象一下,你擁有一個存儲出租倉庫,并雇人為你管理倉庫。管理人員開始創建了一份電子表格,列明了所有租戶。幾個月過去了,一些租戶需要更多空間,另一些租戶則需要更少空間。租戶搬進搬出。
又過了幾個月,這個電子表格已經沒有更新,你不知道找誰收租或者誰租了哪個空間。你的租戶開始利用這個情況,由于你的收租過程并不準確,他們就可以趁機在不交額外費用的情況下使用更多空間。再進一步想象,你在世界各地都有倉庫…
對于非結構化數據,企業都面臨相同的問題。在企業內,人們進來或離開,新部門需要訪問數據,而一些部門已經不再需要訪問權。這種“數據管理”大部分都是以電子表格來管理的,導致了大量時間密集型書面工作,如果信息不更新的話,電子表格就沒用了。
更大的問題是扣款模式并不是不存在或者沒有部署,而是沒有強制執行。由于用戶并不需要對他們在網絡附加存儲(NAS)控制器上使用的空間負責,于是他們將所有信息都存儲在這些控制器上,而不知道這對企業成本造成的影響。當你考慮一些這些數據將被復制以用于災難恢復(DR)、快照和備份到磁帶(虛擬的、物理的,或者兩者皆有)等目的時,這種成本將難以估計。
有幾個問題需要考慮。首先,大多數NAS廠商并不能處理大量企業級非結構化數據。兩個最大NAS廠商(NetApp和EMC)都沒有解決全球命名空間問題或者讓其硬件根據需要向外擴展,因為基礎設施由數據孤島組成,關聯一個數據孤島和另一個孤島并不存在簡單的方法。在大多數情況下,NAS設備將數據作為工作組來處理,而不是全球客戶的單一大型scale-out(向外擴展)NAS解決方案。
例如,微軟使用Active Directory(AD)解決了單一大型scale-out目錄服務。AD是單一數據庫,對于跨國性企業,AD物理分布在各地辦事處(如紐約、倫敦、新加坡、東京和法蘭克福等),AD主要處理復制。當你查詢AD時,你可以查找任何對象信息。如果用戶在紐約,他可以查詢在東京的對象。但NAS并不能做到這一點。
因此,非結構化數據只能從工作組級或者信息孤島來看待。要查詢NAS設備上的數據,你需要登錄到一臺設備,然后登錄到另一臺來查詢另一臺NAS設備上的信息。NAS并不能像用戶使用AD那樣在整個企業內查詢信息或者運行報告。
其次,由于基于網絡文件共享(NFS)和CIFS的安全性從本質上來看非常不同,真正多協議訪問可能造成失去安全控制或者不兼容問題。因為CIFS是一項微軟的技術,用戶賬戶信息存儲在AD中。使用Unix為基礎的NFS的公司使用NIS作為他們NFS的主要賬戶存儲庫。
這兩個獨立的賬戶存儲庫讓企業很難從單個應用程序來管理全球數據。如果沒有堅實的扣款機制(大部分企業沒有執行),非結構化數據的使用將無法問責。除非部署物理限制,再加上一個良好的扣款程序,用戶才會保存所有他們在NAS存儲上寫入和讀取的信息,非常像一個亂七八糟的衣柜。
非結構化數據的管理對于企業來說是非常艱巨的任務,而日常管理員需要對非結構化數據有某種可視性。這個意味著需要一個解決方案,允許管理員從全球整體來查看他們的非結構化數據。
有一次,作為美國最大銀行之一的全球NAS實驗室的管理人員,我需要將一個NAS設備返還給廠商。首先,我需要安排設備清理。我花了很長時間才弄清楚哪些人使用過這個NAS設備,最后,只能靠猜測。關于非結構數據的基本問題都是很難回答的。誰訪問過NAS設備?這方面部署了怎樣的安全策略?如果我想要分層存儲,哪些政策最有意義?
如果應用程序可以將所有這些信息生成到一份報告中,那么中層管理人員就可以解釋為什么分層能夠為企業節省成本,以及哪些分層政策最有意義。此外,IT安全人員將能夠查看和加強安全部署方法來解決數據安全方面的問題。操作人員可以監控延遲情況,快速找出是誰造成NAS設備的延遲性。當試圖從快照恢復虛擬機時,如果一個應用程序可以作為全球目錄,并追蹤文件存儲位置,以及提供日期和時間戳,基于磁盤備份的文件恢復將更快且更簡單。
簡而言之,目前的非結構化數據的管理并不存在或者很糟糕。市場迫切地需要一個應用程序能夠提供對非結構化數據的真正可視性,這些非結構化數據正呈直線上升,變得越來越難以管理。
原文鏈接:http://storage.it168.com/a2012/0118/1303/000001303623.shtml