PredictCaseLikelihood (DMX)
這個函數會傳回輸入案例符合現有模型的可能性。只適用於群集模型。
語法
PredictCaseLikelihood([NORMALIZED|NONNORMALIZED])
引數
NORMALIZED
傳回值包含模型內案例的機率除以無模型案例的機率。NONNORMALIZED
傳回值包含案例的原始機率,也就是案例屬性機率的乘積。
適用於
使用 Microsoft 群集與 Microsoft 時序群集演算法建立的模型。
傳回類型
介於 0 和 1 之間的雙精確度浮點數。較接近 1 的數字代表案例在此模型中發生的機率較高。較接近 0 的數字代表案例較不可能在此模型中發生。
備註
依預設,PredictCaseLikelihood 函數的結果會正規化。隨著案例中的屬性數增加,而任兩個案例之間的原始機率差異更小時,正規化的值通常會變得更有用。
下列方程式是在 x 和 y 已知時,用來計算正規化的值:
x = 以群集模型為基礎的案例可能性
y = 臨界案例可能性,根據計算培訓案例而計算為案例的對數可能性
Z = Exp( log(x) – Log(Y))
正規化 = (z/ (1+z))
範例
下列範例根據 Adventure Works DW 資料庫,傳回指定的案例在叢集模型內出現的可能性。
SELECT
PredictCaseLikelihood() AS Default_Likelihood,
PredictCaseLikelihood(NORMALIZED) AS Normalized_Likelihood,
PredictCaseLikelihood(NONNORMALIZED) AS Raw_Likelihood,
FROM
[TM Clustering]
NATURAL PREDICTION JOIN
(SELECT 28 AS [Age],
'2-5 Miles' AS [Commute Distance],
'Graduate Degree' AS [Education],
0 AS [Number Cars Owned],
0 AS [Number Children At Home]) AS t
預期的結果:
Default_Likelihood |
Normalized_Likelihood |
Raw_Likelihood |
---|---|---|
6.30672792729321E-08 |
6.30672792729321E-08 |
9.5824454056846E-48 |
這些結果之間的差異示範了正規化的效果。CaseLikelihood 的原始值建議案例的機率約為 20%;不過,如果將結果正規化,則案例的可能性會明顯地變得非常低。