Aracılığıyla paylaş


percentile(), percentiles() (toplama işlevi)

Şunlar için geçerlidir: ✅Microsoft Fabric✅Azure Veri Gezgini Azure İzleyiciMicrosoft Sentinel

işlevi, expr tarafından tanımlanan popülasyonun belirtilen en yakın sıralama yüzdebirliği için percentile() bir tahmin hesaplar. Doğruluk, yüzdebirlik bölgenin popülasyon yoğunluğuna bağlıdır.

percentiles() ile benzer şekilde percentile()çalışır. Ancak, percentiles() her yüzdebirlik değeri ayrı ayrı hesaplamaktan daha verimli olan birden çok yüzdebirlik değeri aynı anda hesaplayabilir.

Ağırlıklı yüzdebirlik dilimleri hesaplamak için bkz . yüzdebirlik dilimlerw().

Not

Bu işlev summarize işleciyle birlikte kullanılır.

Sözdizimi

percentile(ifade, yüzdebirliği)

percentiles(ifade, yüzdebirlik dilimleri)

Söz dizimi kuralları hakkında daha fazla bilgi edinin.

Parametreler

Ad Tür Zorunlu Açıklama
ifade string ✔️ Toplama hesaplaması için kullanılacak ifade.
Yüzdebirlik int veya long ✔️ Yüzde birlik değeri belirten bir sabit.
yüzdebirlik dilimler int veya long ✔️ Bir veya daha fazla virgülle ayrılmış yüzdebirlik.

Döndürülenler

Her biri ayrı bir sütunda olmak üzere grupta belirtilen yüzdebirlik değerlerin ifade tahminlerini içeren bir tablo döndürür.

Not

Tek bir sütundaki yüzde birlik değerleri döndürmek için bkz . Yüzdebirlik değerleri dizi olarak döndürme.

Örnekler

Tek yüzdebirlik değeri hesaplama

Aşağıdaki örnekte, örnek kümesinin %95'inden DamageProperty büyük ve örnek kümesinin %5'inden küçük olma değeri gösterilmektedir.

StormEvents | summarize percentile(DamageProperty, 95) by State

Çıktı

Gösterilen sonuçlar tablosu yalnızca ilk 10 satırı içerir.

State percentile_DamageProperty_95
ATLANTIK GÜNEY 0
FLORIDA 40000
GEORGIA 143333
MISSISSIPPI 80000
AMERİKAN SAMOASI 250000
KENTUCKY 35000
OHIO 150000
KANSAS 51392
MICHIGAN 49167
ALABAMA Kategori 50000

Birden çok yüzdebirlik değerleri hesaplama

Aşağıdaki örnekte 5, 50 (ortanca) ve 95 kullanılarak aynı anda hesaplanan değeri DamageProperty gösterilmektedir.

StormEvents | summarize percentiles(DamageProperty, 5, 50, 95) by State

Çıktı

Gösterilen sonuçlar tablosu yalnızca ilk 10 satırı içerir.

State percentile_DamageProperty_5 percentile_DamageProperty_50 percentile_DamageProperty_95
ATLANTIK GÜNEY 0 0 0
FLORIDA 0 0 40000
GEORGIA 0 0 143333
MISSISSIPPI 0 0 80000
AMERİKAN SAMOASI 0 0 250000
KENTUCKY 0 0 35000
OHIO 0 Kategori 2000 150000
KANSAS 0 0 51392
MICHIGAN 0 0 49167
ALABAMA 0 0 Kategori 50000
... ...

Yüzdebirlik değerleri dizi olarak döndürme

Değerleri tek tek sütunlarda döndürmek yerine işlevini kullanarak percentiles_array() dinamik dizi türünde tek bir sütundaki yüzde birlik değerleri döndürebilirsiniz.

Sözdizimi

percentiles_array(ifade, yüzdebirlik dilimleri)

Parametreler

Ad Tür Zorunlu Açıklama
ifade string ✔️ Toplama hesaplaması için kullanılacak ifade.
yüzdebirlik dilimler int, long veya dinamik ✔️ Bir veya daha fazla virgülle ayrılmış yüzdebirlik dilim veya dinamik bir yüzdebirlik dizi. Her yüzdebirlik bir tamsayı veya uzun değer olabilir.

Döndürülenler

Dinamik dizi türünde tek bir sütun olarak grupta belirtilen yüzdebirlik değerlerin ifadeleri için bir tahmin döndürür.

Örnekler

Virgülle ayrılmış yüzdebirlik dilimler

Birden çok yüzdebirlik değerler, birden çok sütun yerine tek bir dinamik sütunda dizi olarak elde edilebilir.

TransformedSensorsData
| summarize percentiles_array(Value, 5, 25, 50, 75, 95), avg(Value) by SensorName

Çıktı

Sonuçlar tablosu yalnızca ilk 10 satırı görüntüler.

SensorName percentiles_Value avg_Value
sensor-82 ["0.048141473520867069","0.24407515500271132","0.48974511106780577","0.74160998970950343","0.94587903204190071"] 0.493950914
sensor-130 ["0.049200214398937764","0.25735850440187535","0.51206374010048239","0.74182335059053839","0.95210342463616771"] 0.505111463
sensor-56 ["0.04857779335488676","0.24709868149337144","0.49668762923789589","0.74458470404241883","0.94889104840865857"] 0.497955018
sensor-24 ["0.051507199150534679","0.24803904945640423","0.50397070213183581","0.75653888126010793","0.9518782718727431"] 0.501084379
sensor-47 ["0.045991246974755672","0.24644331118208851","0.48089197707088743","0.74475142784472248","0.9518322864959039"] 0.49386228
sensor-135 ["0.05132897529660399","0.24204987641954018","0.48470113942206461","0.74275730068433621","0.94784079559229406"] 0.494817619
sensor-74 ["0.048914714739047828","0.25160926036445724","0.49832498850160978","0.75257887767110776","0.94932261924236094"] 0.501627252
sensor-173 ["0.048333149363009836","0.26084250046756496","0.51288012531934613","0.74964772791583412","0.95156058795294"] 0.505401226
sensor-28 ["0.048511161184567046","0.2547387968731824","0.50101318228599656","0.75693845702682039","0.95243122486483989"] 0.502066244
sensor-34 ["0.049980293859462954","0.25094722564949412","0.50914023067384762","0.75571549713447961","0.95176564809278674"] 0.504309494
... ... ...

Yüzdebirlik dinamik dizi

için percentiles_array yüzdebirlik değerleri dinamik bir tamsayı veya kayan noktalı sayı dizisinde belirtilebilir. Dizinin sabit olması gerekir, ancak değişmez değer olması gerekmez.

TransformedSensorsData
| summarize percentiles_array(Value, dynamic([5, 25, 50, 75, 95])), avg(Value) by SensorName

Çıktı

Sonuçlar tablosu yalnızca ilk 10 satırı görüntüler.

SensorName percentiles_Value avg_Value
sensor-82 ["0.048141473520867069","0.24407515500271132","0.48974511106780577","0.74160998970950343","0.94587903204190071"] 0.493950914
sensor-130 ["0.049200214398937764","0.25735850440187535","0.51206374010048239","0.74182335059053839","0.95210342463616771"] 0.505111463
sensor-56 ["0.04857779335488676","0.24709868149337144","0.49668762923789589","0.74458470404241883","0.94889104840865857"] 0.497955018
sensor-24 ["0.051507199150534679","0.24803904945640423","0.50397070213183581","0.75653888126010793","0.9518782718727431"] 0.501084379
sensor-47 ["0.045991246974755672","0.24644331118208851","0.48089197707088743","0.74475142784472248","0.9518322864959039"] 0.49386228
sensor-135 ["0.05132897529660399","0.24204987641954018","0.48470113942206461","0.74275730068433621","0.94784079559229406"] 0.494817619
sensor-74 ["0.048914714739047828","0.25160926036445724","0.49832498850160978","0.75257887767110776","0.94932261924236094"] 0.501627252
sensor-173 ["0.048333149363009836","0.26084250046756496","0.51288012531934613","0.74964772791583412","0.95156058795294"] 0.505401226
sensor-28 ["0.048511161184567046","0.2547387968731824","0.50101318228599656","0.75693845702682039","0.95243122486483989"] 0.502066244
sensor-34 ["0.049980293859462954","0.25094722564949412","0.50914023067384762","0.75571549713447961","0.95176564809278674"] 0.504309494
... ... ...

En yakın sıralama yüzdebirliği

Artan düzende sıralanan sıralı değerler listesinin P. yüzdebirliği ( <0 P<= 100), listedeki en küçük değerdir. Verilerin P yüzdesi, P. yüzdebirlik değere (yüzdebirlik dilimler hakkındaki Wikipedia makalesinden) eşit veya daha küçüktür.

0. yüzdebirlik dilimleri, popülasyonun en küçük üyesi olacak şekilde tanımlayın.

Not

Hesaplamanın yaklaşık doğası göz önünde bulundurulduğunda, döndürülen gerçek değer popülasyonun bir üyesi olmayabilir. En yakın derece tanımı, P=50'nin ortanca değerin ilişkilendirilmiş tanımına uymadığı anlamına gelir. Belirli bir uygulama için bu tutarsızlığı değerlendirirken popülasyonun boyutu ve tahmin hatası dikkate alınmalıdır.

Yüzdebirlik dilimlerde tahmin hatası

Yüzdebirlik dilimler toplamı, T-Digest kullanarak yaklaşık bir değer sağlar.

Not

  • Tahmin hatasının sınırları, istenen yüzdebirlik değeriyle farklılık gösterir. En iyi doğruluk [0..100] ölçeğinin her iki ucundadır. 0 ve 100 yüzdebirlik dilimleri, dağılımın tam olarak en düşük ve en yüksek değerleridir. Doğruluk, ölçeğin ortasına doğru yavaş yavaş azalır. Ortanca değerde en kötü durumdur ve %1 ile eşlenir.
  • Hata sınırları değerde değil derecelendirmede gözlemlenir. Yüzdebirlik(X, 50) değerinin Xm değerini döndürdü. Tahmin, X değerlerinin en az %49'unun ve en çok %51'inin Xm değerine eşit veya daha az olmasını garanti eder. Xm ile X'in gerçek ortanca değeri arasındaki farkta teorik bir sınır yoktur.
  • Tahmin bazen kesin bir değere neden olabilir, ancak ne zaman olacağını tanımlamak için güvenilir bir koşul yoktur.