Dataguise日前公布了實(shí)施Hadoop的十大最佳做法。專業(yè)人員可以通過遵循管理隱私風(fēng)險(xiǎn),數(shù)據(jù)和安全管理的程序,杜絕敏感數(shù)據(jù)外泄,降低風(fēng)險(xiǎn)狀況,從而更好地滿足合規(guī)性要求。
通過財(cái)富200強(qiáng)企業(yè)中的Hadoop安全部署經(jīng)驗(yàn)總結(jié),Dataguise開發(fā)出以下十大建議,以確保大型和復(fù)雜多樣環(huán)境下的數(shù)據(jù)安全。
信息技術(shù)工具的日益更新和功能的不斷優(yōu)化成熟,使得大數(shù)據(jù)的使用變得更具有可行性。然而,這一新技術(shù)領(lǐng)域的優(yōu)勢(shì)往往還伴隨著數(shù)據(jù)隱私的問題。在這些龐大的信息庫(kù)中,個(gè)人身份信息(PII ),如姓名,地址和社會(huì)安全號(hào)碼都存在泄露的可能。
1、先下手為強(qiáng)!在規(guī)劃部署階段就確定數(shù)據(jù)的隱私保護(hù)策略,最好是在將數(shù)據(jù)放入到Hadoop之前就確定好保護(hù)策略。
2、確定哪些數(shù)據(jù)屬于企業(yè)的敏感數(shù)據(jù)。根據(jù)公司的隱私保護(hù)政策,以及相關(guān)的行業(yè)法規(guī)和政府規(guī)章來綜合確定。
3、及時(shí)發(fā)現(xiàn)敏感數(shù)據(jù)是否暴露在外,或者是否導(dǎo)入到Hadoop中。
4、搜集信息并決定是否暴露出安全風(fēng)險(xiǎn)。
5、確定商業(yè)分析是否需要訪問真實(shí)數(shù)據(jù),或者確定是否可以使用這些敏感數(shù)據(jù)。然后,選擇合適的加密技術(shù)。如果有任何疑問,對(duì)其進(jìn)行加密隱藏處理,同時(shí)提供最安全的加密技術(shù)和靈活的應(yīng)對(duì)策略,以適應(yīng)未來需求的發(fā)展。
6、確保數(shù)據(jù)保護(hù)方案同時(shí)采用了隱藏和加密技術(shù),尤其是如果我們需要將敏感數(shù)據(jù)在Hadoop中保持獨(dú)立的話。
7、確保數(shù)據(jù)保護(hù)方案適用于所有的數(shù)據(jù)文件,以保存在數(shù)據(jù)匯總中實(shí)現(xiàn)數(shù)據(jù)分析的準(zhǔn)確性。
8、確定是否需要為特定的數(shù)據(jù)集量身定制保護(hù)方案,并考慮將Hadoop的目錄分成較小的更為安全的組。
9、確保選擇的加密解決方案可與公司的訪問控制技術(shù)互操作,允許不同用戶可以有選擇性地訪問Hadoop集群中的數(shù)據(jù)。
10、確保需要加密的時(shí)候有合適的技術(shù)(比如Java、Pig等)可被部署并支持無(wú)縫解密和快速訪問數(shù)據(jù)。