企業(yè)數(shù)據(jù)工程師正在以前所未有的力度和規(guī)模運(yùn)用數(shù)據(jù)集,比如改造供應(yīng)鏈模型、應(yīng)對日益增加的欺詐行為或開發(fā)新的產(chǎn)品線等。對于數(shù)據(jù)科學(xué)家而言,海量數(shù)據(jù)造成的瓶頸會直接影響企業(yè)訓(xùn)練和使用模型的成本與速度。Cloudera與NVIDIA的集成有望幫助企業(yè)快速應(yīng)對新出現(xiàn)的以及持續(xù)的業(yè)務(wù)挑戰(zhàn),并提供具有洞察力的分析。
美國國稅局研究應(yīng)用分析與統(tǒng)計(jì)司技術(shù)部門主管JoeAnsaldi表示:“我們需要能夠運(yùn)用大量數(shù)據(jù)快速做出準(zhǔn)確的決策。隨著數(shù)據(jù)量和速度不斷提高,這一挑戰(zhàn)也在不斷變化。憑借Cloudera和NVIDIA的集成,我們將能夠運(yùn)用以數(shù)據(jù)為依據(jù)的洞察為欺詐檢測等關(guān)鍵任務(wù)應(yīng)用提供支持。目前我們正在完成上述集成,并且已經(jīng)看到數(shù)據(jù)工程和數(shù)據(jù)科學(xué)工作流程的速度提升了三倍以上。”
對于努力應(yīng)對海量數(shù)據(jù)集的公司而言,能否進(jìn)行模型訓(xùn)練取決于是否擁有開源GPU加速數(shù)據(jù)科學(xué)管道。這種管道可以直接增強(qiáng)企業(yè)機(jī)構(gòu)運(yùn)用AI進(jìn)行業(yè)務(wù)轉(zhuǎn)型的能力。GPU加速的ApacheSpark3能夠在CDP上無縫運(yùn)行,從而支持企業(yè)機(jī)構(gòu)可以通過安全且可擴(kuò)展的開源機(jī)器學(xué)習(xí)平臺,滿足從研發(fā)到生產(chǎn)的高性能計(jì)算(HPC)、AI和數(shù)據(jù)科學(xué)需求。
Cloudera首席產(chǎn)品官ArunMurthy表示:“在速度至關(guān)重要的今天,企業(yè)比以往任何時(shí)候都更加依賴數(shù)據(jù)的力量。Cloudera與NVIDIA的合作將為客戶提供必要的技術(shù)支持,幫助客戶更好地理解數(shù)據(jù),并充分發(fā)掘真正的AI轉(zhuǎn)型潛力。CDP分析體驗(yàn)專為幫助數(shù)據(jù)專家跨多個(gè)公有云和私有云、自信應(yīng)對指數(shù)級數(shù)據(jù)增長和孤島式數(shù)據(jù)分析而構(gòu)建的。接下來我們將深化與NVIDIA的現(xiàn)有集成,通過使用我們的企業(yè)數(shù)據(jù)云服務(wù),客戶將可以保持他們現(xiàn)有的競爭優(yōu)勢。”
NVIDIA數(shù)據(jù)科學(xué)產(chǎn)品組高級總監(jiān)ScottMcClellan表示:“ApacheSpark為企業(yè)保持競爭力所依賴的機(jī)器學(xué)習(xí)和數(shù)據(jù)分析管道奠定了基礎(chǔ)。NVIDIA加速的計(jì)算和運(yùn)行在ClouderaDataPlatform上的Spark分析所帶來的處理能力,提供了如期高速完成任務(wù)的靈活性,同時(shí)節(jié)省成本。”
用于ApacheSpark的RAPIDS加速器將于今年夏天在CDP私有云版本中提供。NVIDIA與Cloudera將陸續(xù)在CDP中推出更多的加速產(chǎn)品,5月將會在CDP公有云中提供深度學(xué)習(xí)和機(jī)器學(xué)習(xí)加速產(chǎn)品。