當人們還在置疑大數據的空穴來風時,沃爾瑪的經典營銷案例“啤酒與尿布”已經在業內廣為流傳。當人們還在置疑大數據的行業應用時,以互聯網為代表的電商行業已經在利用大數據進行掘金。國金證券TMT行業分析師趙國棟表示,傳統企業在大數據的應用上確實沒有電商有先知先覺,因為電商的主要資產就是數據,有消費者的行為記錄,能夠快速了解消費者的需求。
大數據在電商的三種應用方式
“用戶好不容易來了,死活也不能讓他走”,這是所有電商的愿望,如何快速準確的吸引用戶找到想要的商品;如何加大商品的有效曝光;如何滿足用戶的需求,推薦其偏好的商品;如何提高用戶的活躍度,降低用戶的棄單率,這些都是令電商一直很頭疼的問題。
亞馬遜通過自己研發的精準推薦系統每秒賣出的商品達72.9件,如此誘人的數字,令國內很多電商企業饞涎不已。亞馬遜的經驗有一個很奇怪的名字叫“鬼打墻式的推薦”,就是一路跟著你,所有瀏覽行為幾乎都看得到。
所有電商都在學習亞馬遜的經驗,目前在電商中常用的推薦方式有1.買了還買2.看了還看3.瀏覽后買的4.對其它相關的感興趣5.個性化郵件,據蘭繆內衣技術總監田旭介紹,目前這些方式基本能滿足需求,相關推薦主要集中在商品頁和購物車頁面。
據蘭繆內衣技術總監田旭介紹,在Apache推出Hadoop之后,才開始有“推薦引擎”這種服務,之前只是谷歌、亞馬遜有自己的一套東西。
推薦引擎是電商在大數據應用的一個主要方式,基于用戶在網站上的瀏覽行為,對用戶進行分門別類,有哪些用戶購買了哪些商品,有哪些用戶瀏覽了哪些商品,根據這些瀏覽、購買、評價行為為不同的用戶推薦不同的商品。
智能郵件推送也是常用的一個方式,針對某個人的瀏覽行為推送一款產品。根據你的瀏覽和搜索記錄,即使你沒有產生購買行為,最終會把可能是你要買的產品發到你的郵箱。據田旭介紹,亞馬遜在這方面做的更極致,,一般的直郵發一百萬份,每一個都一樣,但亞馬遜是每一個人都不一樣,他們會把單獨一件商品直接發郵件推薦給用戶,這個人看到馬上崩潰了,立馬就買了。
商品預測是亞馬遜獨有的一種方式。在新產品上線后,經過前5天的交易記錄,就能得出一個分析結果,這個商品多長時間能賣完,是正常商品、熱銷的還是滯銷的。如果商品沒達到相應的標準,亞馬遜可以根據和商家簽訂的退貨協議,把剩余的商品全部退還商家。田旭說到,這個目前在國內還沒有人能做到如此,這也是亞馬遜能立于不敗之地的原因。
電商的大數據作為
在大數據推動的商業革命暗涌中,要么學會使用大數據的杠桿創造商業價值,要么被大數據驅動的新生代商業格局淘汰。這是天賜良機,更是生死之戰。目前大部分電商都有自己的“大數據”策略,在愈演愈烈的市場競爭上占取更有利的地位。
據知意圖產品經理魏平介紹,在國內做得不錯的有淘寶、京東這樣的公司,他們有足夠的資金和能力去自行研發,但是對于大部分電商企業來說自行研發消耗的成本巨大,中小型電商企業考慮其它的方式,自行研發是沒必要的。
蘭繆內衣技術總監田旭告訴記者,目前大數據在國內只有一種產品就是推薦引擎,從技術架構分為兩種,一是廠商提供一體機的集成方案直接安裝到本地的機房,如果數據量增大,可以直接加服務器,廠商會提供相應的監控和其它服務。二是云服務分析,用戶只需要把服務廠商提供代碼嵌入到網站上即可,進行分析之后,會有相應結果反饋回來。對于會不會擔憂有數據的安全性的問題,田旭表示肯定是會擔心,也需要未來在相關法律和法規的完善。此外,還有一個好處,采用這種分析方式,還會抓取同類網站上的數據,通過比對分析,得出相應的推薦結果。田旭說到,“采用大數據技術,可以提高轉化率,一般可以在原有轉換率的基礎上提高15%,比如你現在的轉換率是2% ,在使用推薦引擎以后會提高到2.3%。”
淘寶“云梯”計劃
淘寶無論在人才、技術方面都有強大的實力,目前已經擁有國內最大的Hadoop集群,采用x86服務器,存儲容量50PB。這個集群還有一個很好聽的名字“云梯”,短短四年時間,已經由300臺擴張到近2900臺規模。
淘寶還根據自身的業務需求,開發了自己的Hadoop分支——ADFS。主要解決HDFS NameNode在設計上存在單點故障、內存瓶頸,以及集群重啟時間過長,期間無法對集群進行寫操作等問題。
阿里集團技術共享平臺核心系統研發部海量數據技術專家羅李認為,在Hadoop技術的使用上,還是應該從業務解決出發,有海量數據需要處理,并且計算模型并不太復雜,對數據進行處理的過程可以分成一個個小的步驟去完成,就可以嘗試Hadoop 技術。
京東“電商云“布局
京東商城目前正在構建一個“電商云”,用云計算給大數據提供一個開放式的、分布式的計算的技術支撐。據京東商城副總裁李曦介紹在分析和建模都投入了大量的力理,如何把分析結果快速的通過報表工具展現,如何為數據進行實時的建模,比如用戶買了一段奶粉,當她再買的時候,仍會推薦一段奶粉,而不是二段、三段的奶粉。
京東商城數據部資深架構師李松林在數據收集方面早已實現了全面自動化,同時為了保證數據質量,以給最后的數據挖掘和分析,以及最終呈現給用戶的關聯搜索和個性化營銷,他們采取了3種方法。一種是首先保證數據源的質量,其次是通過一些手段對初級收集的數據進行清洗,第三是從審計方面再次保證數據的質量。
當當網對于大數據的探索
當當網副總裁胡毅表示,數據挖掘其實最大的價值是讓我們更多的去了解我們的用戶。一方面是借助數據挖掘,使我們知道用戶是一個什么樣的情況,有些什么樣的變化。第二方面,數據挖掘會對于改善我們的用戶體驗,幫助我們發現一些新的機會。