Condividi tramite


Che cos'è il data warehousing in Microsoft Fabric?

Si applica a:✅ endpoint di Analisi SQL e Warehouse in Microsoft Fabric

Fabric Data Warehouse è una soluzione di data warehousing di nuova generazione all'interno di Microsoft Fabric.

L'archiviazione incentrata su lake è basata su un motore di elaborazione distribuito di livello aziendale che consente prestazioni leader del settore su larga scala riducendo al minimo la necessità di configurazione e gestione. Situato nel data lake e progettato per supportare in modo nativo i formati di dati aperti, il data warehouse in Fabric consente una perfetta collaborazione tra ingegneri dei dati e utenti aziendali senza compromettere la sicurezza o la governance.

L'esperienza SaaS facile da usare è anche strettamente integrata con Power BI per semplificare l'analisi e la creazione di report, facendo convergere il mondo dei data lake e quello dei warehouse e semplificando notevolmente l'investimento di un'organizzazione nelle proprie risorse di analisi. 

I clienti del data warehouse traggono i seguenti vantaggi:

  • I dati archiviati in formato Delta-Parquet consentono transazioni ACID, mentre l'interoperabilità con altri carichi di lavoro di Fabric significa che non sono necessarie più copie di dati.
  • Le query tra database possono usare più origini dati per ottenere rapidamente informazioni dettagliate senza duplicare i dati.
  • Inserire, caricare e trasformare facilmente i dati su larga scala tramite pipeline, flussi di dati, query tra database o il comando COPY INTO.
  • La gestione autonoma dei carichi di lavoro con il motore di elaborazione delle query distribuite leader del settore significa che non c'è alcuna manopola da azionare per ottenere le prestazioni milgiori della categoria.
  • Ridimensionare quasi istantaneamente per soddisfare le esigenze aziendali. Archiviazione e calcolo sono separati.
  • Riduzione del tempo per ottenere informazioni dettagliate con un modello semantico facile da usare e sempre connesso integrato con Power BI in modalità Direct Lake. I report dispongono sempre dei dati più recenti per l'analisi e la creazione di report.
  • Creato per qualsiasi livello di competenza, dal citizen developer all'amministratore del database o all'ingegnere dei dati.

Oggetti del data warehousing

Fabric Data Warehouse non è un data warehouse aziendale tradizionale, si tratta di un lake warehouse che supporta due diversi elementi di warehousing: il data warehouse di Fabric e l'endpoint di analisi SQL. Entrambi sono appositamente creati per soddisfare le esigenze aziendali dei clienti, offrendo le migliori prestazioni della categoria, riducendo al minimo i costi e il sovraccarico amministrativo.

Data warehouse dell'infrastruttura

In un'area di lavoro di Microsoft Fabric un warehouse fabric viene etichettato come Warehouse nella colonna Tipo . Quando sono necessarie le funzionalità di piena potenza e transazionale (supporto di query DDL e DML) di un data warehouse, questa è la soluzione più rapida e semplice.

Screenshot che mostra il tipo di Warehouse nell'area di lavoro.

Il warehouse può essere popolato con uno dei metodi di inserimento dati supportati, come COPY INTO, Pipeline, Flussi di dati, od opzioni di inserimento tra database, come CREATE TABLE AS SELECT (CTAS), INSERT..SELECT o SELECT INTO.

Per iniziare a usare il Warehouse, consultare:

Endpoint di analisi SQL del Lakehouse

In un'area di lavoro di Microsoft Fabric, ogni Lakehouse ha un "endpoint di analisi SQL" generato automaticamente che può essere usato per passare dalla vista "Lake" del Lakehouse (che supporta l'ingegneria dei dati e Apache Spark) alla vista "SQL" dello stesso Lakehouse per creare viste, funzioni, stored procedure e applicare la sicurezza SQL.

Screenshot che mostra il tipo di endpoint di analisi SQL nell'area di lavoro.

Con l'endpoint di analisi SQL del Lakehouse, i comandi T-SQL possono definire ed eseguire query su oggetti dati, ma non manipolare o modificare i dati. Nell'endpoint di analisi SQL è possibile effettuare le seguenti azioni:

  • Eseguire query sulle tabelle che fanno riferimento a dati nelle cartelle Delta Lake nel lake.
  • Creare viste, funzioni con valori di tabella inline e procedure per incapsulare la semantica e la logica di business in T-SQL.
  • Gestire le autorizzazioni per gli oggetti.

Per iniziare a usare l'endpoint di analisi SQL, consulta:

Warehouse o lakehouse

Quando si decide di usare un warehouse o un lakehouse, è importante considerare le esigenze specifiche e il contesto dei requisiti di gestione e analisi dei dati. Sebbene sia importante, non si tratta di una decisione unidirezionale!

È sempre possibile aggiungere l'uno o l'altro in un secondo momento, in caso di cambiamento delle esigenze aziendali e indipendentemente dalla posizione iniziale, poiché il warehouse e il lakehouse usano lo stesso potente motore SQL per tutte le query T-SQL.

Ecco alcune linee guida generali utili per prendere una decisione:

  • Scegliere un data warehouse quando è necessaria una soluzione su scala aziendale con formato standard aperto, senza il ricorso a manopole e con una configurazione minima.  Ideale per formati di dati semistrutturati e strutturati, il data warehouse è adatto per professionisti dei dati sia principianti che esperti, offrendo esperienze semplici e intuitive.

  • Scegliere un lakehouse quando è necessaria una grande repository di dati altamente non strutturati da origini eterogenee, sfruttando l'archiviazione di oggetti a basso costo, e si desidera usare SPARK come strumento di sviluppo principale. Fungendo da data warehouse "leggero", è sempre possibile usare l'endpoint SQL e gli strumenti T-SQL per fornire scenari di creazione di report e di data intelligence nel lakehouse.

Per indicazioni più dettagliate sulla decisione migliore, consultare la Guida alle decisioni di Microsoft Fabric: Scegliere tra Warehouse e Lakehouse.