摘要: 堆疊是集成多個分類法或回歸模型的方式。有很多方法可以集成模型,眾所周知的模型有Bagging或Boosting。Bagging允許多個具有高方差類似的分類模型中取平均以減少差異。Boosting建立多個增量模型,以減少誤差,同時保持方差小。

 


堆疊是集成多個分類法或回歸模型的方式。有很多方法可以集成模型,眾所周知的模型有Bagging或Boosting。Bagging允許多個具有高方差類似的分類模型中取平均以減少差異。Boosting建立多個增量模型,以減少誤差,同時保持方差小。

堆疊(有時稱為堆疊泛化)是不同的範例。堆疊的一點是要對同個問題探索不同模型的空間。這個想法是,你可以以不同類型的模型去攻略一個機器學習問題,不同模型能夠學習問題的某些部分,但不是學習到問題的全部。所以你可以建立多個不同的學習方式並使用它們來構建中間預測,一個學習模型產生一個預測。然後使用中介預測去訓練一個新模型去學同個目標。

1.我們的訓練數據分成K-部分就像K-fold交叉驗證。

2.一個基本模型配適在K-1部份和預測第K部分。

3.此動作重複在訓練數據的每個部分。

4.然後,將基礎模型配適在整個訓練數據集來計算其測試集的績效。

5.我們重複了其他基本模型在上面3個步驟。

6.從訓練組的預測被用作特徵在於用於所述第二級模型。

7.第二級模型是用來做的測試集的預測。

Blending

Blending是一種類似堆疊的方法。

1.訓練集分成訓練和驗證集。

2.我們訓練trainu資料集的基礎模型。

3.我們只對驗證集和測試集做預測。

4.驗證集的預測被用作特性來構建一個新的模型。

5.該模型是使用預測值作為特徵來做出測試組的最終預測。

轉貼自: geeksforgeeks

 

若喜歡本文,請關注我們的臉書 Please Like our Facebook Page:    Big Data In Finance

 


留下你的回應

以訪客張貼回應

0
  • 找不到回應

Popular Tags