共用方式為


建立測試集 (資料採礦精靈)

使用 [ 建立測試集 ] 頁面可指定要用於定型的數據量,以及要保留多少數據做為測試集。 當您建立採礦結構時,將數據分成定型和測試集,可讓您更輕鬆地評估稍後建立的採礦模型精確度。

您可以將測試數據量指定為百分比,也可以指定數位來限制用於測試的案例數目。 如果您同時指定要用於測試的百分比和案例數目上限,則會使用這兩個設定,而測試數據集包含較少的案例數目。 根據預設,30% 的數據會用於測試、70% 用於定型,而且沒有測試案例的最大數目。

根據預設,Analysis Services 會產生用來開始數據分割的數值種子。 此種子是以採礦結構的名稱為基礎。 如果您想要確保即使採礦結構的名稱變更,數據分割仍維持不變,您可以藉由設定採礦結構的 HoldoutSeed 屬性來指定種子的值。 如果您變更鑒效組種子,則必須重新處理 結構。

如果您稍後想要變更測試或定型數據的數量,您可以使用 [屬性] 視窗來修改HoldoutMaxCases數據採礦結構的 HoldoutMaxPercent 屬性。 不過,進行變更之後,您必須重新處理採礦結構和所有相關聯的採礦模型。 下列限制也適用於:

  • 只有在數據採礦結構儲存在 SQL Server 2008 中時,才支援數據採礦結構的分割。 舊版的 SQL Server Analysis Services 不支援快取採礦結構的數據分割資訊。

  • 如果採礦結構包含時間序列採礦模型所需的索引鍵時間數據行,則您無法分割採礦結構。

  • 如果您嘗試預測儲存在巢狀數據表中的值,則無法分割數據。

如需詳細資訊:測試和驗證(數據採礦)建立關係型採礦結構基本數據採礦教學課程

選項。

測試的數據百分比
按兩下向上和向下箭號,以增加或減少要當做定型集使用的數據百分比,或在文字框中輸入介於0到100之間的值。

測試數據集中的案例數目上限
輸入數位以限制可用於測試的案例數目。

如果您指定的數位大於數據中實際案例的數目,則會使用所有案例。

預設值是 NULL。 這表示沒有限制。

另請參閱

資料採礦精靈 F1 說明 (Analysis Services - 數據採礦)
建議相關資料列 (資料採礦精靈)
指定資料表型態 (資料採礦精靈)
指定資料列的內容與資料型態 (資料採礦精靈 )