請在腦海中描繪出太陽的模樣,它強大的引力將各個行星牢牢鎖在運行軌道之中。
在當今的企業運營中,數據也發揮著類似的影響。某一位置上新數據集的穩定積累會吸引更多的數據。而當大量數據集都集中在一處時,訪問就成了難題。龐大臃腫的“數據引力”中心令數據篩選和有效數據的選取過程變得困難。企業更加難以獲得能對其收入產生重大積極影響的洞察。
雖然數據引力的出現可能不是一種顛覆性的現象,但它確實有可能影響到IT基礎架構的構建。企業在做出任何與數據有關的重大決策之前,都需要考慮到數據引力中不斷變化的諸多因素。
數據引力的成因
了解數據引力的成因有助于應對數據引力本身。
數據匯集于企業,因此數據引力可以追溯到企業自身。據估計,到2025年,企業將承載全球80%的數據。此外,每當企業進行并購或啟動新的大型分析項目時,新的數據引力中心便會出現。雖然過去大多數數據的最終歸宿是數據倉庫,但隨著工業物聯網(IIoT)在邊緣的使用日益增加,數據集的位置也在發生變化。可以看到的是,數據引力正在與新的數據處理方法同步發展。
在AI這一改變范式的技術被全面接受之前,數據引力就已經在積聚力量。而現在由于AI帶來了數據增長,有關數據引力的挑戰就變得更加復雜。使用AI時需要考慮的另一個因素是,數據的位置會因是訓練數據模型還是實際使用數據模型而有所不同。在AI領域,無論是在云端、本地還是邊緣,數據的位置都尤為重要。擁有一個未來就緒的數據中心,有助于快速從數據中獲取洞察,情況將大有不同。
這些挑戰都將隨著AI應用的增加而凸顯。據戴爾科技2023“GenAI脈搏調查”(Generative AI Pulse Survey)數據顯示,受訪的500名IT決策者中有76%表示其正在增加AI方面的預算。同樣有76%左右的受訪者認為,即使并非變革性的,生成式AI也將對其企業產生十分重大的影響。
數據引力和基礎架構
企業必須考慮與數據引力相關的諸多因素,尤其是在AI項目成為當務之急時。
首先,企業需要明確在哪里計算和存儲數據。企業將在哪里訓練AI數據模型,又要在哪里使用由此生成的算法?戴爾科技的“GenAI脈搏調查”顯示,82%的IT領導者傾向于采用本地部署或混合方式進行數據管理。
工業物聯網和邊緣AI的發展涉及到邊緣數據處理,這意味著企業需要明確有多少數據需要在邊緣處理,又有多少數據可以傳輸到云端。
企業采取的基于云的軟件即服務(SaaS)程序也會決定其訪問數據的方式。此外,隱私權和安全法規的要求則決定企業和其他組織機構存儲和處理數據的位置。
這一長串“在哪里”問題的答案將決定相關IT基礎架構的布局,包括數據中心、本地部署和混合云服務以及其他數據存儲、訓練和處理位置。
在云中、本地或使用混合模式管理數據時的成本同樣受到數據引力的巨大影響,并且影響著數據管理策略。事實上,來回移動數據的成本很高,企業也正在探索變通之法,通過虛擬化和云鄰近存儲等機制提高效率。
其次是管理問題。企業若能確定需要移動多少數據才能使其發揮作用,同樣可以幫助解決數據引力問題并構建基礎架構。有多少數據是真正需要處理的,又有多少是需要保留的,這是亟待企業回答的問題。企業越能更好地管理大量數據,就越能減輕數據引力帶來的一些不利影響。
數據管理計劃
企業該如何制定一個健全的數據引力感知管理項目呢?首先,企業可以列出可提高數據引力的資源。為此,企業需要了解有哪些情況會影響到這一點,例如公司進行了哪些新的數據投資?近期將有何種舉措可能會增加數據引力?
企業需要知道數據節點的位置,包括是否需要在特定位置設置特定數據集?是在邊緣進行實時處理,還是因數據主權法而需要在特定國家/地區進行處理?
企業只需傳輸真正需要的數據。諸多工具可供使用,虛擬化只是其中之一,企業可以通過這些工具實現他們想要的數據驅動結果,無需到處轉移數據集并創建新的數據引力中心。
企業還可以考慮使用托管服務。通過與戴爾科技合作,建立必要的IT基礎架構模塊助力當前及未來的AI項目。戴爾科技的高性能存儲和低成本對象存儲如PowerStore、PowerScale和ObjectScale,在幫助企業部署本地AI規模方面處于有利地位。
Dell PowerStore是面向企業的智能全閃存存儲,具有高度適應性,適用于數據塊、文件、Virtual Volumes (vVols) 和容器工作負載。全新的軟件驅動型創新可在瞬息萬變的環境中為數據保駕護航并更大限度地利用資源。將能源效率提高多達 60%, 在 90 秒內設置云備份,并加速采用零信任網絡安全。
Dell PowerScale是一款靈活、安全且高效的橫向擴展 NAS 解決方案,可輕松處理要求嚴苛的關鍵數據密集型項目。
最新發布的全新全閃存存儲PowerScale F210和PowerScale F710充分利用了新一代硬件和軟件,提供無可比擬的性能和規模、卓越的效率、極高的安全性以及多云敏捷性。F210和F710配備NVMe SSD固態盤,作為 AI-Ready 數據平臺的首選,可為客戶提供更高的密度和更高的性能。搭載最新的OneFS 9.7操作系統,實現了針對AI數據工作流程所有階段的性能優化,性能顯著提升,全面加固并升級安全。F210和F710極大地豐富了PowerScale的NVMe全閃存產品陣容,具有GPU Direct以及其他嵌入式功能,例如無中斷擴展、多租戶功能、支持多協議的通用數據訪問、極高安全性以及與公有云的靈活性和無縫互操作性等,支持要求最苛刻的文件工作負載,如AI和GenAI。
Dell ObjectScale是一種高性能容器化對象存儲,針對AI、分析等要求嚴苛的應用程序和工作負載而打造。它具備出廠即用的全局命名空間、強大的 S3 兼容性和企業級安全性,可以幫助各種規模的組織加速創新。現在還增加了軟件定義的選項,專門為 Kubernetes 打造,以對象存儲設備的形式提供,功能更加強大。
數據是神圣的,對任何企業來說都至關重要。在AI炙手可熱的當下,擁有一個將數據引力因素考慮在內的強大數據戰略,AI技術的潛力必將得到充分發揮。