Funzione hll_sketch_estimate
Si applica a: Databricks SQL Databricks Runtime 13.3 LTS e versioni successive
Questa funzione utilizza l'algoritmo HyperLogLog per contare un'approssimazione probabilistica del numero di values univoci in un determinato column, utilizzando una rappresentazione binaria nota come buffer di schizzo generato in precedenza dalla funzione hll_sketch_agg e restituendo il risultato come un numero intero grande.
Le funzioni hll_union e hll_union_agg possono anche combinare gli schizzi utilizzando e unendo questi buffer come input.
L'implementazione usa la libreria Apache Datasketches. Per altre informazioni, vedere HLL .
Sintassi
hll_sketch_estimate ( expr )
Argomenti
-
expr
BINARY
: espressione che contiene uno schizzo generato da hll_sketch_agg.
Valori restituiti
Valore BIGINT
che rappresenta il conteggio distinto approssimativo rappresentato dallo schizzo di input.
Esempi
> SELECT hll_sketch_estimate(hll_sketch_agg(col, 12))
FROM VALUES (1), (1), (2), (2), (3) tab(col);
3
> SELECT hll_sketch_estimate(hll_sketch_agg(col))
FROM VALUES (1), (1), (2), (2), (3) tab(col);
3