レッスン 1: 時系列マイニング モデルおよびマイニング構造の作成
対象: SQL Server 2016 Preview
このレッスンでは、履歴データを基に時間の経過に応じて値を予測するためのマイニング モデルを作成します。 モデルを作成すると、基になる構造が自動的に生成され、追加のマイニング モデルのベースとして使用できるようになります。
このレッスンは、予測モデルおよび Microsoft タイム シリーズ アルゴリズムの要件について理解していることを前提としています。 詳細については、「Microsoft タイム シリーズ アルゴリズム」を参照してください。
CREATE MINING MODEL ステートメント
使用するマイニング モデルを直接作成し、基になるマイニング構造を自動的に生成するために、 マイニング モデルの作成 #40; DMX ) ステートメントです。 ステートメントのコードは、次の部分に分割できます。
モデルの名前指定
タイム スタンプの定義
省略可能な系列キー列の定義
予測可能な属性の定義
CREATE MINING MODEL ステートメントの汎用例を次に示します。
CREATE MINING MODEL [<Mining Structure Name>]
(
<key columns>,
<predictable attribute columns>
)
USING <algorithm name>([parameter list])
WITH DRILLTHROUGH
コードの 1 行目では、マイニング モデルの名前を定義します。
CREATE MINING MODEL [Mining Model Name]
Analysis Services では、基になる構造に対し、モデル名の後に「_structure」を追加した名前が自動的に生成されます。これにより、構造名がモデル名と重複しないことが保証されます。 DMX でオブジェクトを名前付け方法の詳細については、次を参照してください。 識別子 #40; DMX )します。
コードの次の行では、マイニング モデルのキー列を定義します。キー列は、時系列モデルでソース データの時間ステップを一意に識別します。 時間ステップが付いた、 KEY TIME 列の名前とデータ型の後のキーワードです。 使用して認識されますが、タイム シリーズ モデルに別々 の系列キーがある場合、 キー キーワードです。
<key columns>
コードの次の行では、予測対象となるモデル内の列を定義します。 1 つのマイニング モデルに複数の予測可能な属性を含めることができます。 予測可能な属性が複数ある場合は、Microsoft タイム シリーズ アルゴリズムによって系列ごとに個別に分析が生成されます。
<predictable attribute columns>
このレッスンの作業
このレッスンでは、次の作業を行います。
新しい空のクエリの作成
マイニング モデルを作成するためのクエリの変更
クエリを実行します。
クエリを作成します。
最初の手順では、Analysis Services で、SQL Server Management Studio のインスタンスに接続して新しい DMX クエリを作成します。
SQL Server Management Studio で新しい DMX クエリを作成するには
SQL Server Management Studio を開きます。
サーバーへの接続 ] ダイアログ ボックスの サーバーの種類, [ Analysis Servicesします。 サーバー名, 、型 LocalHost, のインスタンスの名前または Analysis Services このレッスンで接続します。 **[接続]**をクリックします。
オブジェクト エクスプ ローラー, のインスタンスを右クリックして Analysis Services, 、指す 新しいクエリ, 、順にクリック DMXします。
クエリ エディターが開き、新しい空のクエリが表示されます。
クエリの変更
次の手順では、CREATE MINING MODEL ステートメントを変更して、予測に使用されるマイニング モデルがその基になるマイニング構造と共に作成されるようにします。
CREATE MINING MODEL ステートメントをカスタマイズするには
クエリ エディターで、CREATE MINING MODEL ステートメントの汎用例を空のクエリにコピーします。
次の部分を探します。
[mining model name]
これを次の文字列に置き換えます。
[Forecasting_MIXED]
次の部分を探します。
<key columns>
これを次の文字列に置き換えます。
[Reporting Date] DATE KEY TIME, [Model Region] TEXT KEY
時間キー キーワードは、ReportingDate 列に値を順にステップ値が使用された時間が含まれていることを示します。 時間ステップのデータ型は、値が一意でデータの並べ替えが可能であれば、日付/時刻型、整数型、任意の順序付きデータ型のどれでもかまいません。
テキスト と キー キーワードは、ModelRegion 列に追加の系列キーが含まれていることを示します。 使用できる系列キーは 1 つに限られており、列内の値は一意である必要があります。
次の部分を探します。
< predictable attribute columns> )
これを次の文字列に置き換えます。
[Quantity] LONG CONTINUOUS PREDICT, [Amount] DOUBLE CONTINUOUS PREDICT )
次の部分を探します。
USING <algorithm name>([parameter list]) WITH DRILLTHROUGH
これを次の文字列に置き換えます。
USING Microsoft_Time_Series (AUTO_DETECT_PERIODICITY = 0.8, FORECAST_METHOD = 'MIXED') WITH DRILLTHROUGH
アルゴリズム パラメーター AUTO_DETECT_PERIODICITY = 0.8 では、データの循環を検出するアルゴリズムの場合に指定します。 1 に近い値を設定すると、多数のパターンを検出できますが、処理に時間がかかる可能性があります。
アルゴリズム パラメーター FORECAST_METHOD, 、ARTXP、ARIMA、または両方の組み合わせを使用して分析するデータをするかどうかを示します。
キーワード、 WITH DRILLTHROUGH, 、モデルが完了したら、ソース データの詳細な統計情報を表示できるように指定します。 Microsoft タイム シリーズ ビューアーでモデルを参照する場合は、この句を追加する必要があります。 予測にはこの句は必要ありません。
最終的なステートメントは次のようになります。
CREATE MINING MODEL [Forecasting_MIXED] ( [Reporting Date] DATE KEY TIME, [Model Region] TEXT KEY, [Quantity] LONG CONTINUOUS PREDICT, [Amount] DOUBLE CONTINUOUS PREDICT ) USING Microsoft_Time_Series (AUTO_DETECT_PERIODICITY = 0.8, FORECAST_METHOD = 'MIXED') WITH DRILLTHROUGH
ファイル ] メニューのをクリックして 付けて DMXQuery1.dmx を保存します。
名前を付けて保存 ダイアログ ボックスで、適切なフォルダーに移動し、ファイル名 Forecasting_MIXED.dmxします。
クエリの実行
最後の手順では、クエリを実行します。 クエリを作成して保存したら、そのクエリを実行してサーバーにマイニング モデルとそのマイニング構造を作成します。 クエリ エディターでクエリの実行の詳細については、次を参照してください。 データベース エンジン クエリ エディターと #40 です。SQL Server Management Studio と #41;します。
クエリを実行するには
クエリ エディターで、ツールバーで、クリックして Executeします。
クエリの状態が表示される、 メッセージ ステートメントの実行完了後のクエリ エディター下部にあるタブをクリックします。 この場合次のメッセージが表示されます。
Executing the query Execution complete
という名前の新しい構造 Forecasting_MIXED_Structure が関連するマイニング モデルと共に、サーバーに存在するようになりました Forecasting_MIXEDします。
次のレッスンでは、マイニング モデルを追加、 Forecasting_MIXED 作成したマイニング構造です。
次のレッスン
レッスン 2: 時系列マイニング構造へのマイニング モデルの追加
参照
タイム シリーズ モデルのマイニング モデル コンテンツ (Analysis Services - データ マイニング)
Microsoft タイム シリーズ アルゴリズム テクニカル リファレンス