basket, plug-in
S’applique à : ✅Microsoft Fabric✅Azure Data Explorer
Le basket
plug-in recherche des modèles fréquents d’attributs dans les données et retourne les modèles qui passent un seuil de fréquence dans ces données. Un modèle représente un sous-ensemble des lignes qui ont la même valeur sur une ou plusieurs colonnes. Le basket
plug-in est basé sur l’algorithme Apriori développé à l’origine pour l’exploration de données d’analyse du panier.
Syntaxe
Tevaluate
(
| basket
[ Threshold,
WeightColumn,
MaxDimensions,
CustomWildcard CustomWildcard,
,
... ])
En savoir plus sur les conventions de syntaxe.
Paramètres
Nom | Type | Requise | Description |
---|---|---|---|
Seuil | long |
Dans double la plage de 0,015 à 1 qui définit le ratio minimal des lignes à considérer comme fréquents. Les modèles avec un ratio plus petit ne seront pas retournés. La valeur par défaut est 0,05. Pour utiliser la valeur par défaut, entrez le tilde : ~ .Exemple : T | evaluate basket(0.02) |
|
WeightColumn | string |
Nom de colonne à utiliser pour prendre en compte chaque ligne de l’entrée en fonction du poids spécifié. Doit être un nom d’une colonne de type numérique, telle que int , long real . Par défaut, chaque ligne a un poids de 1. Pour utiliser la valeur par défaut, entrez le tilde : ~ . Il est courant d’utiliser une colonne de pondération en prenant en compte l’échantillonnage ou la création de compartiments/l’agrégation des données déjà incorporées dans chaque ligne.Exemple : T | evaluate basket('~', sample_Count) |
|
MaxDimensions | int |
Définit le nombre maximal de dimensions non liées par panier, limitées par défaut, pour réduire le runtime de requête. La valeur par défaut est 5. Pour utiliser la valeur par défaut, entrez le tilde : ~ .Exemple : T | evaluate basket('~', '~', 3) |
|
CustomWildcard | string |
Définit la valeur de caractère générique pour un type spécifique dans la table de résultats qui indique que le modèle actuel ne présente pas de restriction sur cette colonne. La valeur par défaut est null à l’exception des colonnes de chaîne dont la valeur par défaut est une chaîne vide. Si la valeur par défaut est une bonne valeur dans les données, une autre valeur générique doit être utilisée, par * exemple . Pour utiliser la valeur par défaut, entrez le tilde : ~ .Exemple : T | evaluate basket('~', '~', '~', '*', int(-1), double(-1), long(0), datetime(1900-1-1)) |
Remarque
Pour spécifier un paramètre facultatif qui suit un paramètre facultatif, veillez à fournir une valeur pour le paramètre facultatif précédent. Pour plus d’informations, consultez Utilisation des paramètres facultatifs.
Retours
Le basket
plug-in retourne des modèles fréquents qui passent un seuil de ratio. Le seuil par défaut est 0,05.
Chaque modèle est représenté par une ligne dans les résultats. La première colonne est l’ID de segment. Les deux colonnes suivantes sont le nombre et le pourcentage de lignes, à partir de la requête d’origine qui correspond au modèle. Les colonnes restantes sont liées à la requête d’origine, avec une valeur spécifique de la colonne ou une valeur générique, qui est par défaut null, ce qui signifie une valeur de variable.
Remarque
L’algorithme utilise l’échantillonnage pour déterminer les valeurs fréquentes initiales. Par conséquent, les résultats peuvent légèrement différer entre plusieurs exécutions pour les modèles dont la fréquence est proche du seuil.
Exemple
StormEvents
| where monthofyear(StartTime) == 5
| extend Damage = iff(DamageCrops + DamageProperty > 0 , "YES" , "NO")
| project State, EventType, Damage, DamageCrops
| evaluate basket(0.2)
Sortie
ID de segment | Count | Pourcentage | État | Type d’événement | Dommage | Récoltes |
---|---|---|---|---|---|---|
0 | 4574 | 77,7 | NON | 0 | ||
1 | 2278 | 38,7 | Grêle | NON | 0 | |
2 | 5675 | 96,4 | 0 | |||
3 | 2371 | 40,3 | Grêle | 0 | ||
4 | 1279 | 21,7 | Vent d’orage | 0 | ||
5 | 2468 | 41,9 | Grêle | |||
6 | 1310 | 22.3 | OUI | |||
7 | 1291 | 21,9 | Vent d’orage |
Exemple avec des caractères génériques personnalisés
StormEvents
| where monthofyear(StartTime) == 5
| extend Damage = iff(DamageCrops + DamageProperty > 0 , "YES" , "NO")
| project State, EventType, Damage, DamageCrops
| evaluate basket(0.2, '~', '~', '*', int(-1))
Sortie
ID de segment | Count | Pourcentage | État | Type d’événement | Dommage | Récoltes |
---|---|---|---|---|---|---|
0 | 4574 | 77,7 | * | * | NON | 0 |
1 | 2278 | 38,7 | * | Grêle | NON | 0 |
2 | 5675 | 96,4 | * | * | * | 0 |
3 | 2371 | 40,3 | * | Grêle | * | 0 |
4 | 1279 | 21,7 | * | Vent d’orage | * | 0 |
5 | 2468 | 41,9 | * | Grêle | * | -1 |
6 | 1310 | 22.3 | * | * | OUI | -1 |
7 | 1291 | 21,9 | * | Vent d’orage | * | -1 |