Condividi tramite


Mirroring Snowflake in Microsoft Fabric

Il mirroring in Fabric offre un'esperienza semplice per evitare complessi ETL (Extract Transform Load) e integrare i dati esistenti del warehouse Snowflake con il resto dei dati in Microsoft Fabric. È possibile replicare continuamente i dati Snowflake esistenti direttamente in OneLake di Fabric. All'interno di Fabric è possibile sbloccare potenti scenari di business intelligence, intelligenza artificiale, Ingegneria dei dati, data science e condivisione dei dati.

Per un'esercitazione sulla configurazione del database Snowflake per il mirroring in Fabric, vedere Esercitazione: Configurare i database con mirroring di Microsoft Fabric da Snowflake.

Perché usare il mirroring in Fabric?

Con il mirroring in Fabric, non è necessario unire servizi diversi da più fornitori. Invece, è possibile usufruire di un prodotto end-to-end altamente integrato e facile da usare, progettato per semplificare le esigenze di analisi e creato per l'apertura e la collaborazione tra Microsoft, Snowflake e le migliaia di soluzioni tecnologiche in grado di leggere il formato di tabella Delta Lake open source.

Quali esperienze di analisi sono integrate?

I database con mirroring sono un elemento di Fabric Archiviazione dati distinto dall'endpoint di analisi warehouse e SQL.

Diagramma del mirroring del database di Fabric per Snowflake.

Il mirroring crea tre elementi nell'area di lavoro di Fabric:

  • Elemento del database con mirroring. Il mirroring gestisce la replica dei dati in OneLake e la conversione in Parquet, in un formato pronto per l'analisi. Questo consente scenari downstream quali ingegneria dei dati, data science e altri.
  • Un endpoint di Analisi SQL
  • Un modello semantico predefinito

Ogni database con mirroring dispone di un endpoint di analisi SQL generato automaticamente, che offre un'esperienza analitica avanzata sulle tabelle Delta create dal processo di mirroring. Gli utenti hanno accesso a comandi T-SQL familiari che possono definire ed eseguire query su oggetti dati, ma non modificare i dati dall'endpoint di analisi SQL, in quanto si tratta di una copia di sola lettura. Nell'endpoint di analisi SQL è possibile effettuare le seguenti azioni:

  • Esplorare le tabelle che fanno riferimento ai dati nelle tabelle Delta Lake da Snowflake.
  • Ceare query senza codice e visualizzazioni ed esplorare visivamente i dati senza scrivere una riga di codice.
  • Sviluppare viste SQL, TVF (funzioni con valore di tabella) inline e procedure archivate per incapsulare la semantica e la logica di business in T-SQL.
  • Gestire le autorizzazioni per gli oggetti.
  • Eseguire query sui dati in altre Warehouse e Lakehouse nella stessa area di lavoro.

Oltre all'editor di query SQL, è disponibile un ampio ecosistema di strumenti in grado di eseguire query sull'endpoint di analisi SQL, tra cui SQL Server Management Studio (SSMS), l'estensione mssql con Visual Studio Code e anche GitHubCopilot.

Considerazioni relative alla sicurezza

Per abilitare il mirroring di Fabric, è necessaria l’autorizzazione dell’utente per il database Snowflake che contiene le seguenti autorizzazioni:

  • CREATE STREAM
  • SELECT table
  • SHOW tables
  • DESCRIBE tables

Per altre informazioni, vedere la documentazione di Snowflake sui Privilegi di Controllo di accesso per le tabelle di Streaming e sulle Autorizzazioni necessarie per i flussi.

Importante

Qualsiasi sicurezza granulare stabilita nella warehouse Snowflake di origine deve essere riconfigurata nel database mirror di Microsoft Fabric. Per altre informazioni, vedere Autorizzazioni granulari SQL in Microsoft Fabric.

Considerazioni sul costo di Snowflake con mirroring

Fabric non addebita costi per l'ingresso dei dati di rete in OneLake per il mirroring. Non sono previsti costi di mirroring quando i dati Snowflake vengono replicati in OneLake.

Sono previsti costi di calcolo e query cloud Snowflake quando i dati vengono sottoposti a mirroring: calcolo della warehouse virtuale e calcolo dei servizi cloud.

  • Costi di calcolo della warehouse virtuale Snowflake:
    • I costi di calcolo verranno addebitati a Snowflake se sono presenti modifiche ai dati che vengono letti in Snowflake e a loro volta vengono sottoposti a mirroring in Fabric.
    • Tutte le query di metadati eseguite in background per verificare la presenza di modifiche ai dati non vengono addebitate per qualsiasi calcolo Snowflake; tuttavia, le query che producono dati, ad esempio SELECT * riattivano la warehouse Snowflake e verranno addebitate le risorse di calcolo.
  • Costi di calcolo dei servizi Snowflake:
    • Anche se non sono previsti costi di calcolo per le attività in background, ad esempio la creazione, la query di metadati, il controllo di accesso, la visualizzazione delle modifiche dei dati e anche la query DDL, sono previsti costi cloud associati a queste query.
    • A seconda del tipo di edizione Snowflake, verranno addebitati i crediti corrispondenti per i costi dei servizi cloud.

Nello screenshot seguente è possibile visualizzare i costi di calcolo della warehouse virtuale e dei servizi cloud per il database Snowflake associato di cui viene eseguito il mirroring in Fabric. In questo scenario, la maggior parte dei costi di calcolo dei servizi cloud (in giallo) proviene da query di modifica dei dati in base ai punti indicati in precedenza. I costi di calcolo della warehouse virtuale (in blu) provengono rigorosamente dalle modifiche ai dati che vengono letti da Snowflake e sottoposti a mirroring in Fabric.

Screenshot del grafico dei costi di Snowflake.

Per altre informazioni sui costi di query cloud specifici di Snowflake, vedere la Documentazione Snowflake: Informazioni sui costi complessivi.

Passaggio successivo