Condividi tramite


series_cosine_similarity()

Si applica a: ✅Microsoft Fabric

Calcolare la somiglianza del coseno di due vettori numerici.

La funzione series_cosine_similarity() accetta due serie numeriche come input e calcola la somiglianza del coseno.

Sintassi

series_cosine_similarity( serie1, serie2, [*magnitude1, [*magnitude2]])

Altre informazioni sulle convenzioni di sintassi.

Parametri

Nome Digita Obbligatorio Descrizione
series1, series2 dynamic ✔️ Matrici di input con dati numerici.
grandezza1, grandezza 2 real Grandezza facoltativa del primo e del secondo vettore rispettivamente. La grandezza è la radice quadrata del prodotto punto del vettore con se stesso. Se la grandezza non viene specificata, verrà calcolata.

Valori restituiti

Restituisce un valore di tipo real il cui valore è la somiglianza coseno di series1 con series2. Nel caso in cui la lunghezza di entrambe le serie non sia uguale, la serie più lunga verrà troncata alla lunghezza di quella più breve. Qualsiasi elemento non numerico della serie di input verrà ignorato.

Nota

Se una o entrambe le matrici di input sono vuote, il risultato sarà null.

Ottimizzazione delle prestazioni

Per prestazioni migliorate e requisiti di archiviazione ridotti quando si usa questa funzione, è consigliabile usare i Vector16 criteri di codifica per l'archiviazione di vettori a virgola mobile che non richiedono precisione a 64 bit, ad esempio incorporamenti di vettori di Machine Learning. Il Vector16 profilo, che utilizza la rappresentazione a virgola mobile Bfloat16 , può ottimizzare significativamente l'operazione e ridurre le dimensioni di archiviazione di un fattore pari a 4. Per altri dettagli sui Vector16 criteri di codifica, vedere Tipi di criteri di codifica.

Esempio

datatable(s1:dynamic, s2:dynamic)
[
    dynamic([0.1,0.2,0.1,0.2]), dynamic([0.11,0.2,0.11,0.21]),
    dynamic([0.1,0.2,0.1,0.2]), dynamic([1,2,3,4]),
]
| extend cosine_similarity=series_cosine_similarity(s1, s2)
s1 s2 cosine_similarity
[0.1,0.2,0.1,0.2] [0.11,0.2,0.11,0.21] 0.99935343825504
[0.1,0.2,0.1,0.2] [1,2,3,4] 0.923760430703401