大數據玩家eBay：在購買前洞察你的慾望

摘要: 在網絡世界，數據就是金錢。作為全球最大的拍賣網站，eBay對這一點深有體會。眼下，eBay對各種在線數據的分析無所不至，就像在每個顧客前面安裝了攝像頭一般。毫無疑問，eBay擁有的數據量是驚人的。其每天都要處理10 ...

在網絡世界，數據就是金錢。作為全球最大的拍賣網站，eBay對這一點深有體會。眼下，eBay對各種在線數據的分析無所不至，就像在每個顧客前面安裝了攝像頭一般。

毫無疑問，eBay擁有的數據量是驚人的。其每天都要處理100PB的數據，其中包括50TB的機器數據。可以說，eBay每天都面臨著天文數字般的大數據挑戰

早在2006年，eBay就成立了大數據分析平台。為了準確分析用戶的購物行為，eBay定義了成百上千種類型的數據，並以此對顧客的行為進行跟踪分析。然而，這同時也為eBay帶來了新的挑戰。要知道，公司的數據量多到難以想像，沒有人能分析消化這麼多的數據，也沒有人能基於所有數據建立起模型。

事實上，eBay真正應用到的，只是其收集的數據中的一小部分。 “剩餘的數據，eBay或是將其丟棄，或是將其存儲起來。因為說不定哪天，科技實現了突破，這些數據就會變得有用。 ”eBay大中華區CEO林奕彰指出

那麼目前，eBay是如何利用這些數據，來促進業務創新和利潤增長的呢？/p>

為用戶“畫像”

eBay擁有近2億的用戶，網站的商品清單項目則有3萬多類。在平台的日常交易中，eBay幾乎每秒都要處理數千美元。而這些交易數據，其實只是eBay全站數據信息總量的“冰山一角”。

基於大數據分析，eBay每天要回答的問題有很多，比如，“昨天最熱門的搜索商品是什麼？ ”而即便是這樣的簡單問題，都需要涉及處理五十億的頁面瀏覽量。從這個角度看，任何一個基本的業務問題，對公司來說都是一個相當巨大的問題。

就eBay如何利用大數據來增加在線交易，林奕彰舉了一個典型的例子。譬如，一位年輕的女性早上10點在星巴克瀏覽eBay網站，eBay應該推送給她什麼樣的商品呢？/p>

“就這幾個信息點，我們其實已經做了不少研究。 ”林奕彰說，“事實上，用戶早晨10點、中午12點，或是晚上7點，她瀏覽的商品是不同的；在餐廳或是在家裡，同樣會對瀏覽和搜索產生影響；此外，還有用戶的年齡、當時的天氣等等，都會對購物產生影響。 eBay要做的，就是學習不同情景下的不同購物模式，並推送給用戶最想要的商品。”

據悉，eBay可以從用戶以往的瀏覽記錄裡“猜”她想要什麼樣的商品，也可以從設定的成百上千種情景模型中計算出用戶可能的需求；或是對照另一位有著相似特點的女性用戶，看她當時買過什麼樣的商品，從而推斷出這位用戶潛在的需求。在綜合各種考量因素後，eBay的後台需要在短短幾秒內將商品頁面推送給用戶。這意味著，eBay的系統需要有非常快的運算速度。

這種運算模型，有相當一部分人為的因素。比如，機器可以蒐集用戶的上萬個數據，但eBay的工程師可以定義其中的100個數據為有效數據，而模型則建立在這些有效數據之上。此外，當計算機自動“學習”分析各種數據形成的趨勢時，eBay需要將機器學習的邏輯設定在與商品交易相關的行為上。

除了通過大數據為用戶“畫像”而向其推送有針對性的商品，eBay此前還嘗試利用大數據進行搜索引擎的優化。

具體說來，eBay可以把握用戶的行為模式，使搜索引擎更加“直覺化”。如果時間倒退幾年，用戶在使用eBay的搜索引擎時，會發現它只能理解字面的意思，並按照字面意思尋找。很多時候，搜索引擎並不能理解用戶的真實意圖。但現在，eBay正試著改變或重寫用戶的搜索請求，增加同義詞或替換語句，從而給出更相關性的內容，並由此增加在線交易量。而這背後，統統離不開大數據的支持。

為商家提供“情報”

基於用戶購物的數據，eBay同樣會給商家提供各式各樣的“情報”。比如，eBay會告訴製造商用戶正在網上搜索什麼商品，或是各種出口行業的數據，製造商會立刻對此做出反應。

很多時候，eBay會根據自身或其他電商網站的交易情況，向商家建議其應該銷售的品類。 “這也是eBay大中華區正在做的工作，”林奕彰稱，“比如，一個中國的商家希望將產品賣到澳洲，我們通過數據分析可以告訴他，他一個月大約可以賣出多少產品，定價應該在什麼範圍內，市面上還有多少商家在賣同樣的產品，他的市場佔有率大概是多少”

在此基礎上，eBay還試圖算出商家的補貨頻率。事實上，海外倉儲是商家非常頭痛的問題，一旦計算失誤，便可能造成庫存積壓或缺貨。而在eBay，一旦用戶下單後發現商家缺貨，將是非常嚴重的問題。這種情況下，eBay可以通過過往的數據分析，得出商家第一批貨的大概銷量，以及按照過去銷貨的速度什麼時候應該補貨，物流的時間又是多久。通過這些數據的計算，eBay可以測算出商家補貨的邏輯。

這些數據分析，對於商家開拓新的銷售品類非常管用。因為通常情況下，商家需要四五個月，才能摸清楚一種貨物的淡旺季銷量，及其在各個地區的受歡迎程度

當然，eBay所做的只是為商家提供各種潛在的商機，至於賣家是否願意投入生產，或能否找到合適的供應商進貨，仍需要他們自己去完成。很多時候，eBay推薦商家銷售200個新品類，而最終商家只能找到50種新產品的供應商。

除此之外，憑藉平台上產生的各種信息，eBay還可以扮演“品管(品質管理)”的角色。舉例來說，一個賣家要在eBay上賣1000個產品，當它賣到50個產品的時候，有5個產品出了問題；賣到200個產品的時候，有20個產品出了問題；賣到400個產品的時候，有40個產品出現質量問題，以此類推。而eBay要做的，就是在其早期出現問題的時候，就及時提醒賣家

進一步說，當賣家賣掉10個、20個產品的時候，eBay就要根據退貨率、買家評論等把可能的問題檢測出來。與此同時，eBay會提醒賣家，讓其監督供應商改進品質，或選擇將商品下架，或是修改物品的描述。

在理想狀態下，這種品管系統會形成一個大數據的循環，並幫助賣家減少退貨，銷售更多的商品。假如賣家在收到這樣的通知後依舊我行我素，eBay就會認為這樣的賣家並不重視品管，到了一定階段，eBay會對其實施交易“配額”，限制其交易量

“品管的難點在於，我需要通過數據模型在賣家交易量很少的時候就發現問題。這種早期預測涉及復雜的運算。 ”林奕彰表示，“一旦交易量大了，賣家自己也會統計退貨率，之前的損失也就無可挽回。”

試錯與挑戰

和其他在線交易平台一樣，eBay對假貨亦十分敏感。眼下，公司試圖通過大數據技術，讓系統“智能”地識別出假貨。

實際上，“網絡打假”工作並不容易。要知道，假貨常常以各種形態出現在網絡上，且屢禁不止。以Rolex為例，假貨商家可能在單詞中增加一個空格，也可能將其中兩個字母互換位置，甚至名稱裡根本不出現Rolex，只是圖片展示出Rolex手錶的樣子。 eBay上有如此多的品牌，自然有形形色色的假貨充斥其中。這種情況下，單是靠在商品名稱或描述裡抓關鍵詞，根本抓不住假貨。

而eBay眼下做的，就是通過數據分析建立起一種模型或規則，假如商家的交易符合這種規則或特徵，便有可能是在賣假貨。

打個比方，當一個賣家的商品賣的很便宜，賣得很快，但後面的抱怨和退貨很多，系統就會把這個“可疑”的模式識別出來，然後再由工作人員去判斷，這個賣家是否在賣假貨。換言之，“即便數據的量再大，賣假貨的人都有相對固定的模式。 ”林奕彰稱。而通過這種方式，eBay有效地鑑別出不少假貨商家。

不過，林奕彰並不諱言，這種大數據分析方法亦有其弊端。 “就假貨問題來說，這種方式只能在事後將問題查出來，而無法事先預測。 ”他表示，“這不是那麼容易解決的問題，因為無論用什麼樣的模型去套，假貨交易總是能先騙你一陣子”

除了分析的滯後性，eBay的大數據挑戰還體現在龐大的數據處理上。儘管企業數據倉庫為查詢提供了巨大性能，但它仍無法滿足eBay存儲和靈活處理的需要。要知道，這些系統的造價相當昂貴，當eBay每天增加50TB的數據時，其成本是相當高昂的。

在此基礎上，eBay收集的相當一部分數據，在目前看來是無用的數據。畢竟，數據採集得越多，變量越多，而由此帶來的“數據噪音”也越多，模型越失真。從這個角度看，eBay要做的是記錄那些有意義的數據，並銷毀那些不需要的信息。問題在於，eBay要分析的85%的問題都是新的或未知的，“eBay並不知道哪些信息未來或許會有用，”林奕彰坦言，“那些現在看起來無效的數據，明後年可能就會隨著科技進步被消化，我們現在只能先把這些數據儲存起來。”

但另一廂，假如將所有信息都儲存起來，那麼eBay每個月都會新增數以億計的數據信息。在如此浩瀚的數據海洋中，分析工作根本無從下手。因此對eBay來說，這是一個必須平衡的難題。

需要指出的是，eBay當下的分析模型也還不夠完美。無論是“猜”用戶，還是分析商家在eBay上的生意，eBay猜錯的情況非常非常多。對於這一點，林奕彰舉了信用卡的例子。在他看來，“銀行其實是運用大數據最厲害的，但無論風控模型怎麼完美，全球依然有2%左右的信用卡賠率。 ”況且，eBay用的並不是成熟機構認證過的模型，很多時候要靠自己去猜，那麼誤差也就不足為奇

資料來源：煉數成金

大數據玩家eBay：在購買前洞察你的慾望

在網絡世界，數據就是金錢。作為全球最大的拍賣網站，eBay對這一點深有體會。眼下，eBay對各種在線數據的分析無所不至，就像在每個顧客前面安裝了攝像頭一般。

毫無疑問，eBay擁有的數據量是驚人的。其每天都要處理100PB的數據，其中包括50TB的機器數據。可以說，eBay每天都面臨著天文數字般的大數據挑戰

事實上，eBay真正應用到的，只是其收集的數據中的一小部分。 “剩餘的數據，eBay或是將其丟棄，或是將其存儲起來。因為說不定哪天，科技實現了突破，這些數據就會變得有用。 ”eBay大中華區CEO林奕彰指出

那麼目前，eBay是如何利用這些數據，來促進業務創新和利潤增長的呢？/p>

為用戶“畫像”

eBay擁有近2億的用戶，網站的商品清單項目則有3萬多類。在平台的日常交易中，eBay幾乎每秒都要處理數千美元。而這些交易數據，其實只是eBay全站數據信息總量的“冰山一角”。

就eBay如何利用大數據來增加在線交易，林奕彰舉了一個典型的例子。譬如，一位年輕的女性早上10點在星巴克瀏覽eBay網站，eBay應該推送給她什麼樣的商品呢？/p>

除了通過大數據為用戶“畫像”而向其推送有針對性的商品，eBay此前還嘗試利用大數據進行搜索引擎的優化。

為商家提供“情報”

基於用戶購物的數據，eBay同樣會給商家提供各式各樣的“情報”。比如，eBay會告訴製造商用戶正在網上搜索什麼商品，或是各種出口行業的數據，製造商會立刻對此做出反應。

這些數據分析，對於商家開拓新的銷售品類非常管用。因為通常情況下，商家需要四五個月，才能摸清楚一種貨物的淡旺季銷量，及其在各個地區的受歡迎程度

當然，eBay所做的只是為商家提供各種潛在的商機，至於賣家是否願意投入生產，或能否找到合適的供應商進貨，仍需要他們自己去完成。很多時候，eBay推薦商家銷售200個新品類，而最終商家只能找到50種新產品的供應商。

進一步說，當賣家賣掉10個、20個產品的時候，eBay就要根據退貨率、買家評論等把可能的問題檢測出來。與此同時，eBay會提醒賣家，讓其監督供應商改進品質，或選擇將商品下架，或是修改物品的描述。

“品管的難點在於，我需要通過數據模型在賣家交易量很少的時候就發現問題。這種早期預測涉及復雜的運算。 ”林奕彰表示，“一旦交易量大了，賣家自己也會統計退貨率，之前的損失也就無可挽回。”

試錯與挑戰

和其他在線交易平台一樣，eBay對假貨亦十分敏感。眼下，公司試圖通過大數據技術，讓系統“智能”地識別出假貨。

而eBay眼下做的，就是通過數據分析建立起一種模型或規則，假如商家的交易符合這種規則或特徵，便有可能是在賣假貨。

但另一廂，假如將所有信息都儲存起來，那麼eBay每個月都會新增數以億計的數據信息。在如此浩瀚的數據海洋中，分析工作根本無從下手。因此對eBay來說，這是一個必須平衡的難題。

資料來源：煉數成金

留下你的回應

以訪客張貼回應

在此對話中的人們

回應 (1)

mehmood

釘選列表

喜愛列表

Web Services

YOU MAY BE INTERESTED

Popular Tags

	今日	1293
	昨日	1962
	本週	5587
	本月	4471
	總訪客量	2704224