Funzioni
Si applica a: Databricks Runtime
Spark SQL offre due funzionalità di funzione per soddisfare un'ampia gamma di esigenze: funzioni predefinite e funzioni definite dall'utente.
Per informazioni sulla risoluzione delle funzioni e sulla chiamata di funzione, vedere Chiamata di funzione.
Funzioni predefinite
Questo articolo presenta gli utilizzi e le descrizioni delle categorie di funzioni predefinite usate di frequente per aggregazioni, matrici e mappe, date e timestamp e dati JSON.
Funzioni sql e Python definite dall'utente
Le funzioni definite dall'utente (UDF) di SQL e Python sono funzioni che è possibile definire manualmente, che possono restituire scalari values o set di risultati.
Per altre informazioni, vedere
Funzioni esterne definite dall'utente
Le funzioni definite dall'utente consentono di definire funzioni personalizzate quando le funzioni predefinite del sistema non sono sufficienti per eseguire l'attività desiderata. Per usare le funzioni definite dall'utente, è prima necessario definire la funzione, quindi registrare la funzione con Spark e infine chiamare la funzione registrata. Una funzione definita dall'utente può agire su una singola riga o agire su più righe contemporaneamente. Spark SQL supporta anche l'integrazione di implementazioni Hive esistenti di funzioni definite dall'utente, funzioni di aggregazione definite dall'utente (UDAF) e funzioni definite dall'utente table (UDTF).