Dati negli artefatti di gestione temporanea di Dataflow Gen2
Per migliorare le prestazioni e l'affidabilità, Dataflow Gen2 usa gli elementi di gestione temporanea per archiviare i dati intermedi durante la trasformazione dei dati. Questo articolo fornisce informazioni sugli elementi di gestione temporanea e su come gestire i dati al loro interno.
Che cosa sono gli artefatti di gestione temporanea?
Gli artefatti di gestione temporanea sono percorsi di archiviazione dati intermedi usati da Dataflow Gen2 per archiviare i dati durante la trasformazione dei dati. Questi artefatti passano dai nomi "DataflowsStagingLakehouse" e "DataflowsStagingWarehouse". Gli artefatti di gestione temporanea vengono usati per archiviare i dati intermedi durante la trasformazione dei dati per migliorare le prestazioni. Questi artefatti vengono creati automaticamente quando si crea il primo flusso di dati e vengono gestiti da Dataflow Gen2. Questi artefatti sono nascosti dall'utente nell'area di lavoro, ma potrebbero essere visibili in altre esperienze, ad esempio Recupera dati o Lakehouse Explorer. È consigliabile non accedere o modificare direttamente i dati negli artefatti di gestione temporanea perché potrebbero causare comportamenti imprevisti. Inoltre, l'archiviazione dei dati stessi negli artefatti di gestione temporanea non è supportata e potrebbe comportare la perdita di dati.
Dati negli artefatti di gestione temporanea
Gli artefatti di gestione temporanea non sono progettati per l'accesso diretto da parte degli utenti. Dataflow Gen2 gestisce i dati negli artefatti di gestione temporanea e garantisce che i dati siano in uno stato coerente. L'accesso diretto ai dati negli artefatti di gestione temporanea non è supportato perché non può essere garantito che i dati siano in uno stato coerente. Se è necessario accedere ai dati negli artefatti di gestione temporanea, è possibile usare il connettore del flusso di dati in Power BI, Excel o altri flussi di dati.
La rimozione dei dati dagli artefatti di gestione temporanea può essere forzata da una delle azioni seguenti:
- Disabilitare la gestione temporanea nel flusso di dati e nell'aggiornamento (dopo 30 giorni i dati vengono raccolti in Garbage Collection).
- Eliminare il flusso di dati (rimuove direttamente i dati).
- Eliminare l'area di lavoro (elimina direttamente StagingLakehouse e StagingWarehouse).