共用方式為


判定樹系回歸元件

本文說明 Azure 機器學習 設計工具中的元件。

使用此元件根據判定樹的合奏來建立回歸模型。

設定模型之後,您必須使用加上標籤的數據集和 定型模型元件來定型模型 。 然後,定型的模型可以用來進行預測。

運作方式

判定樹是非參數模型,會針對每個實例執行一系列簡單的測試,並周遊二進位樹狀結構,直到到達分葉節點(決策)為止。

判定樹具有下列優點:

  • 在定型和預測期間,執行運算和記憶體使用都很有效率。

  • 可以代表非線性決策界限。

  • 它們會執行整合式特徵選取和分類,並在出現嘈雜功能時具有彈性。

此回歸模型是由判定樹的合奏所組成。 回歸判定樹系中的每個樹狀結構都會輸出 Gaussian 分佈做為預測。 系統會對樹狀結構整體執行彙總,以找出最接近模型中所有樹狀結構合併分佈的高斯分佈。

如需此演算法理論架構及其實作的詳細資訊,請參閱這篇文章: 判定樹系:分類、回歸、密度估計、Manifold Learning 和半監督式學習的整合架構

如何設定判定樹系回歸模型

  1. 判定樹系回歸 元件新增至管線。 您可以在設計工具的 [機器學習]、[初始化模型] 和 [回歸] 下找到元件。

  2. 開啟元件屬性,然後針對 Resampling 方法,選擇用來建立個別樹狀結構的方法。 您可以選擇 [Bagging ] 或 [複寫]。

    • 嘮叨:Bagging 也稱為 啟動程序匯總。 回歸判定樹系中的每個樹狀結構都會透過預測方式輸出 Gaussian 分佈。 匯總是尋找高斯,其前兩個時刻符合高斯分佈混合的時刻,結合個別樹狀結構傳回的所有分佈。

      如需詳細資訊,請參閱Bootstrap匯總維琪百科專案。

    • 復寫:在複寫中,每個樹狀結構都會在完全相同的輸入數據上定型。 每個樹狀節點會使用哪一個分割述詞的判斷是隨機的,而且樹狀結構會多樣化。

      如需使用複寫選項進行定型程式的詳細資訊,請參閱用於 電腦視覺 和醫學影像分析的判定樹系。西卡西和J.肖頓。Springer 2013..

  3. 藉由設定 [建立定型定型器模式 ] 選項,指定您要如何定型模型。

    • 單一參數

      如果您知道如何設定模型,則可以提供一組特定的值做為自變數。 您可能已透過實驗來了解這些值,或收到這些值作為指引。

    • 參數範圍:如果您不確定最佳參數,而且想要執行參數掃掠,請選取此選項。 選取要逐一查看的值範圍,而 微調模型超參數 會逐一查看您提供之設定的所有可能組合,以判斷產生最佳結果的超參數。

  4. 針對 判定樹數目,表示在合奏中建立的判定樹總數。 藉由建立更多判定樹,您可能會獲得更好的涵蓋範圍,但定型時間將會增加。

    提示

    如果您將值設定為 1;不過,這表示只會產生一個樹狀結構(具有初始參數集的樹狀結構),而且不會再執行任何反覆專案。

  5. 針對 判定樹的最大深度,輸入數位以限制任何判定樹的最大深度。 增加樹狀結構的深度可能會增加精確度,但有一些過度學習和增加訓練時間的風險。

  6. 針對 [ 每個節點隨機分割數目],輸入建置樹狀結構每個節點時要使用的分割數目。 分割表示樹狀結構(節點)每個層級的功能會隨機分割。

  7. 針對 每個分葉節點的樣本數目下限,表示樹狀結構中建立任何終端節點(分葉)所需的最小案例數目。

    藉由增加此值,您可以增加建立新規則的臨界值。 例如,預設值為 1,即使是單一案例,也會導致建立新的規則。 如果您將值增加至 5,定型數據必須包含至少五個符合相同條件的案例。

  8. 定型模型:

    注意

    如果您將參數範圍傳遞至 定型模型,它只會使用單一參數清單中的預設值。

    如果您將單一參數值集合傳遞至 微調模型超參數位 件,當它預期每個參數的設定範圍時,它會忽略這些值,並使用學習者的預設值。

    如果您選取 [ 參數範圍 ] 選項,並針對任何參數輸入單一值,即使您的其他參數在值範圍中變更,您指定的單一值也會在整個掃掠中使用。

  9. 提交管線。

結果

完成定型之後:

  • 若要儲存定型模型的快照集,請選取定型元件,然後在右側面板中切換至 [輸出 ] 索引卷標。 按兩下圖示 [註冊模型]。 您可以在元件樹狀結構中找到已儲存的模型作為元件。

下一步

請參閱 Azure 機器學習 可用的元件集。