PredictCaseLikelihood (DMX)
Cette fonction retourne la probabilité qu'un cas d'entrée corresponde au modèle existant. Uniquement utilisée avec les modèles de clustering.
Syntaxe
PredictCaseLikelihood([NORMALIZED|NONNORMALIZED])
Arguments
NORMALIZED
La valeur de retour contient la probabilité du cas au sein du modèle divisée par la probabilité du cas sans le modèle.NONNORMALIZED
La valeur de retour contient la probabilité brute du cas, qui est le produit des probabilités des attributs de cas.
Application
Les modèles générés par les algorithmes Microsoft Clustering et Microsoft Sequence Clustering.
Type de valeur renvoyé
Nombre à virgule flottante double précision compris entre 0 et 1. Un nombre plus proche de 1 indique que le cas a une probabilité plus élevée de se produire dans ce modèle. Un nombre plus proche de 0 indique qu'il est moins probable que le cas se produise dans ce modèle.
Notes
Le résultat de la fonction PredictCaseLikelihood est normalisé par défaut. Les valeurs normalisées sont généralement plus utiles lorsque le nombre d'attributs d'un cas augmente et que les différences entre les probabilités brutes de deux cas deviennent beaucoup moins importantes.
L'équation suivante est utilisée pour calculer les valeurs normalisées pour des valeurs x et y données :
x = probabilité du cas en fonction du modèle de clustering
y = probabilité de cas marginale, calculée comme le logarithme du rapport de vraisemblance du cas en fonction des cas d'apprentissage
Z = Exp( log(x) – Log(Y))
Normalized = (z/ (1+z))
Exemples
L'exemple suivant retourne la probabilité que le cas spécifié se produira dans le modèle de clustering, qui est basé sur la base de données Adventure Works DW.
SELECT
PredictCaseLikelihood() AS Default_Likelihood,
PredictCaseLikelihood(NORMALIZED) AS Normalized_Likelihood,
PredictCaseLikelihood(NONNORMALIZED) AS Raw_Likelihood,
FROM
[TM Clustering]
NATURAL PREDICTION JOIN
(SELECT 28 AS [Age],
'2-5 Miles' AS [Commute Distance],
'Graduate Degree' AS [Education],
0 AS [Number Cars Owned],
0 AS [Number Children At Home]) AS t
Résultats attendus :
Default_Likelihood |
Normalized_Likelihood |
Raw_Likelihood |
---|---|---|
6.30672792729321E-08 |
6.30672792729321E-08 |
9.5824454056846E-48 |
La différence entre ces résultats montre l'effet de la normalisation. La valeur brute de CaseLikelihood suggère que la probabilité du cas est approximativement de 20 pour cent. Toutefois, lorsque vous normalisez les résultats, il apparaît que la probabilité du cas est très faible.
Voir aussi
Référence
Fonctions DMX (Data Mining Extensions)
Fonctions de prédiction générales (DMX)
Concepts
Algorithmes d'exploration de données (Analysis Services - Exploration de données)