basket プラグイン
basket
プラグインでは、データ内の属性の頻繁なパターンを検出し、そのデータ内に頻度しきい値を渡すパターンを返します。 パターンは、1 つまたは複数の列にわたって同じ値が含まれる行のサブセットを表します。 basket
プラグインは、元々バスケット分析データ マイニング向けに開発された Apriori アルゴリズムに基づいています。
構文
T | evaluate
basket
(
[ Threshold,
WeightColumn,
MaxDimensions,
CustomWildcard,
CustomWildcard,
... ])
構文規則について詳しく知る。
パラメーター
件名 | タイプ | Required | 説明 |
---|---|---|---|
しきい値 | long |
0.015 から 1 の範囲の double で、頻度が高いと見なされる行の最小比率を設定します。 より少ない率のパターンは返されません。 既定値は 0.05 です。 既定値を使用するには、チルダ ( ~ ) を入力します。例: T | evaluate basket(0.02) |
|
WeightColumn | string |
指定した重みに従って入力の各行を考慮するために使用する列名。 int 、long 、real など、数値型の列の名前である必要があります。 既定では、各行の重みは 1 です。 既定値を使用するには、チルダ ( ~ ) を入力します。 weight 列の一般的な使用方法は、既に各行に埋め込まれているデータのサンプリングまたはバケット/集計を考慮することです。例: T | evaluate basket('~', sample_Count) |
|
MaxDimensions | int |
バスケットごとの非相関ディメンションの最大数を設定します。既定では、クエリの実行時間を最短にするために制限されています。 既定値は 5 です。 既定値を使用するには、チルダ ( ~ ) を入力します。例: T | evaluate basket('~', '~', 3) |
|
CustomWildcard | string |
現在のパターンにこの列に対する制限がないことを示す特定の種類のワイルドカード値を結果テーブルに設定します。 既定値は、既定値が空の文字列である文字列列を除き、 null です。 既定値がデータの適切な値である場合は、別のワイルドカード値 (* など) を使用する必要があります。 既定値を使用するには、チルダ ( ~ ) を入力します。例: T | evaluate basket('~', '~', '~', '*', int(-1), double(-1), long(0), datetime(1900-1-1)) |
Note
省略可能なパラメーターの後に省略可能なパラメーターを指定するには、前の省略可能なパラメーターの値を指定してください。 詳細については、「 省略可能なパラメーターを使用した作業を参照してください。
返品
basket
プラグインからは、比率のしきい値を渡す頻繁なパターンが返されます。 既定のしきい値は 0.05 です。
各パターンは、結果内の行によって表されます。 最初の列*はセグメント* ID* です。 次の 2 つの列は、パターンに一致する元のクエリからの count と percentage of rows です。 残りの列は、元のクエリに関連しており、列からの特定の値か、またはワイルドカード値 (既定では null で、変数値を意味する) のいずれかです。
Note
このアルゴリズムでは、サンプリングを使用して初期の頻繁な値を決定します。 その結果、頻度がしきい値に近いパターンについては、複数の実行の間で結果がわずかに異なる可能性があります。
例
StormEvents
| where monthofyear(StartTime) == 5
| extend Damage = iff(DamageCrops + DamageProperty > 0 , "YES" , "NO")
| project State, EventType, Damage, DamageCrops
| evaluate basket(0.2)
出力
セグメント ID | カウント | パーセント | 都道府県 | EventType | Damage (損害) | DamageCrops |
---|---|---|---|---|---|---|
0 | 4574 | 77.7 | いいえ | 0 | ||
1 | 2278 | 38.7 | ひょう | いいえ | 0 | |
2 | 5675 | 96.4 | 0 | |||
3 | 2371 | 40.3 | ひょう | 0 | ||
4 | 1279 | 21.7 | 雷雨風 | 0 | ||
5 | 2468 | 41.9 | ひょう | |||
6 | 1,310 | 22.3 | はい | |||
7 | 1291 | 21.9 | 雷雨風 |
カスタム ワイルドカードを使用した例
StormEvents
| where monthofyear(StartTime) == 5
| extend Damage = iff(DamageCrops + DamageProperty > 0 , "YES" , "NO")
| project State, EventType, Damage, DamageCrops
| evaluate basket(0.2, '~', '~', '*', int(-1))
出力
セグメント ID | カウント | パーセント | 都道府県 | EventType | Damage (損害) | DamageCrops |
---|---|---|---|---|---|---|
0 | 4574 | 77.7 | * | * | いいえ | 0 |
1 | 2278 | 38.7 | * | ひょう | いいえ | 0 |
2 | 5675 | 96.4 | * | * | * | 0 |
3 | 2371 | 40.3 | * | ひょう | * | 0 |
4 | 1279 | 21.7 | * | 雷雨風 | * | 0 |
5 | 2468 | 41.9 | * | ひょう | * | -1 |
6 | 1,310 | 22.3 | * | * | はい | -1 |
7 | 1291 | 21.9 | * | 雷雨風 | * | -1 |