Eseguire query sui dati ad accesso sporadico con finestre ad accesso frequente
Le finestre ad accesso frequente consentono di eseguire query efficienti sui dati ad accesso sporadico senza dover esportare dati o usare altri strumenti. Usare le finestre ad accesso frequente quando le dimensioni dei dati ad accesso sporadico sono grandi e i dati pertinenti provengono da qualsiasi momento in passato. Le finestre ad accesso frequente vengono definite nei criteri della cache.
Azure Esplora dati archivia i dati in un'archiviazione a lungo termine affidabile e memorizza nella cache una parte di questi dati nei nodi del cluster. I criteri di cache regolano i dati memorizzati nella cache. I dati memorizzati nella cache vengono considerati ad accesso frequente, mentre il resto dei dati è considerato sporadico.
Per eseguire query sui dati ad accesso sporadico, Azure Esplora dati elaborare un passaggio di caricamento che richiede l'accesso a un livello di archiviazione con una latenza molto più elevata rispetto al disco locale. Quando la query è limitata a un intervallo di tempo ridotto, spesso denominata query "temporizzato", la quantità di dati da recuperare sarà in genere ridotta e la query verrà completata rapidamente. Ad esempio, le analisi forensi che eseguono query sui dati di telemetria in un determinato giorno nel passato rientrano in questa categoria. L'impatto sulla durata della query dipende dalle dimensioni dei dati estratti dall'archiviazione e può essere significativo. Se si esegue l'analisi di una grande quantità di dati ad accesso sporadico, le prestazioni delle query potrebbero trarre vantaggio dall'uso di finestre ad accesso frequente.
Questo documento illustra come usare le finestre ad accesso frequente per eseguire query sui dati ad accesso sporadico.
Prerequisiti
- Se non si ha una sottoscrizione di Azure, creare un account Azure gratuito prima di iniziare.
- Creare un database e un cluster di Esplora dati di Azure.
- Inserire dati nel cluster con uno dei metodi descritti in Azure Esplora dati panoramica dell'inserimento dati.
Configurare la scalabilità automatica nel cluster
Dopo aver modificato i criteri della cache, il cluster memorizza automaticamente nella cache i dati pertinenti nei dischi. Sarà necessario ridimensionare il cluster per supportare il disco aggiuntivo necessario per la nuova definizione della cache. È consigliabile configurare il cluster per usare le impostazioni di scalabilità automatica ottimizzate .
Nella portale di Azure passare alla risorsa cluster di Azure Esplora dati. In Impostazioni selezionare Scale out.
Nella finestra Scalabilità orizzontale selezionare Scalabilità automatica ottimizzata.
Selezionare un numero minimo di istanze e un numero massimo di istanze. Il ridimensionamento automatico del cluster varia tra questi due numeri, in base al carico.
Seleziona Salva.
Ora è possibile prevedere prestazioni ottimali durante l'uso di finestre ad accesso frequente.
Impostare le finestre ad accesso frequente
Le finestre ad accesso frequente fanno parte della sintassi dei comandi dei criteri della cache e vengono impostate con il .alter policy caching
comando .
Nota
Possono essere necessarie fino a un'ora per aggiornare completamente la cache del disco del cluster in base alla definizione dei criteri di cache aggiornata.
Prendere nota dei criteri di memorizzazione nella cache iniziali usando il
.show policy caching
comando ..show table MyDatabase.MyTable policy caching
Modificare i criteri della cache usando la sintassi seguente. È possibile definire diverse finestre ad accesso frequente per un singolo database o tabella.
.alter <entity_type> <database_or_table_or_materialized-view_name> policy caching hot = <timespan> [, hot_window = datetime(*from*) .. datetime(*to*)] [, hot_window = datetime(*from*) .. datetime(*to*)] ...
Dove:
from
: ora di inizio della finestra di accesso frequente (datetime)to
: ora di fine della finestra ad accesso frequente (datetime)
Ad esempio, le query eseguite nelle impostazioni seguenti esamineranno gli ultimi 14 giorni di dati, sui dati conservati per tre anni.
.alter table MyTable policy caching hot = 14d, hot_window = datetime(2021-01-01) .. datetime(2021-02-01), hot_window = datetime(2021-04-01) .. datetime(2021-05-01)
Esegui query
Eseguire la query o le query desiderate nel periodo di tempo specificato nelle finestre ad accesso frequente.
Ripristinare le impostazioni
- Usare le impostazioni della cache originali recuperate in precedenza in Imposta finestre ad accesso frequente.
- Ripristinare le impostazioni originali dei criteri della cache con il
.alter policy caching
comando .
Poiché è stata configurata la scalabilità automatica ottimizzata per il cluster, il cluster verrà ridotto alle dimensioni originali.