Gestire i dati principali nel data mesh
Le aziende che usano un'architettura mesh di dati spesso hanno un numero elevato di domini, ognuno contenente sistemi e dati univoci.
Questa distribuzione diffusa dei dati aumenta la complessità perché in questa configurazione potrebbero esistere più versioni degli stessi dati. L'integrazione richiede più impegno perché i proprietari devono integrare e uniformare tutte le diverse parti degli stessi dati di più domini. I dati possono essere incoerenti tra questi domini diversi e anche la qualità dei dati può variare. Applicare di gestione dei dati master (MDM) per risolvere questi problemi.
Gestione dei dati master orientata al dominio
I numeri di identificazione principali sono un aspetto importante del Mobile Device Management (MDM). Questi numeri collegano dati padroneggiati e dati relativi ai tuoi domini. Sono fondamentali per consentirti di individuare i dati che sono stati gestiti e quali sono i dati correlati tra loro. È possibile identificare solo i dati univoci e assegnare numeri di identificazione master centralmente, non in locale all'interno di un sistema. I dati master di sistemi diversi devono essere uniti all'interno della soluzione MDM.
MDM funziona in modo diverso nelle architetture orientate al dominio a causa della loro natura distribuita. La coerenza è più difficile da ottenere perché si fa affidamento su MDM all'interno dei domini.
Un modo per ottenere coerenza consiste nel chiedere ai domini di essere conformi ai dati master gestiti centralmente durante la distribuzione di prodotti dati . È possibile pubblicare un elenco di dati master in un archivio dati master o in un repository centrale. Il tuo dominio può classificare i dati usando gli identificatori di riferimento aziendali dai dati di riferimento della tua impresa durante la distribuzione dei prodotti di dati in altri domini. In questo modo gli altri domini riconoscono rapidamente tutti i dati master all'interno di tali prodotti dati.
È anche possibile creare nuovi domini MDM durante il raggruppamento delle attività MDM e l'uso di un archivio dati master come repository centralizzato. Ogni nuovo dominio MDM (Master Data Management) dovrebbe contenere un soggetto dei dati specifico su cui si concentrano l'identificazione e il controllo dei dati master. Alcuni esempi noti di questi dati includono clienti, prodotti, dipendenti, località geografiche e informazioni sui rischi e finanziarie. I dati masterati da questi domini MDM devono tornare ad altri domini. Questa distribuzione dei dati è simile alla distribuzione dei tuoi prodotti di dati.
È possibile definire l'ambito della gestione dei dati master e consentire approcci diversi alla distribuzione dei prodotti dati. Entro i limiti di un determinato ambito, i prodotti dati non devono essere conformi ai dati master aziendali, ma oltre i limiti dell'ambito, i prodotti dati devono essere conformi. È anche possibile applicare questo modello inverso, che richiede l'adesione ai dati master solo all'interno di un ambito specifico e non all'esterno di esso. In queste configurazioni, i dati principali vengono gestiti centralmente all'interno della soluzione MDM. I domini devono scambiare dati master per sapere quali dati locali associare ai dati master centrali. Identificare e gestire queste relazioni in modo da sapere quali dati sono stati gestiti e quali dati è possibile collegare rapidamente. Se le chiavi di dominio locali in un sistema operativo cambiano, un identificatore master è l'unico elemento che associa tutti gli elementi.
Quando si distribuiscono gli identificatori master, non bisogna estrapolare gli identificatori master MDM a tutti i sistemi di origine. In questo modo possono verificarsi problemi di coerenza. Solo le applicazioni o i sistemi soggetti a MDM devono ottenere un identificatore master dall'hub MDM. I sistemi non soggetti a MDM devono usare l'integrità del proprio dominio locale.
Gestione dei dati master a livello di dominio
Quando si cercano dati sovrapposti, è probabile che si rilevino vari gradi di sovrapposizione. Alcuni dati sono generici e si estendono su molti domini. Altri dati hanno sovrapposizioni limitate e si estendono solo su alcuni domini. Distinguere la quantità di dati sovrapposti e la loro importanza estendendo l'MDM all'MDM a livello di dominio. A tale scopo, è possibile creare visualizzazioni parziali dei dati master all'interno di un ambito specifico. Ciò è utile quando i dati vengono condivisi tra alcuni domini, ma non tutti.
È importante che i domini sovrapposti gestiscono i dati, ma non hanno dipendenze centrali. Le soluzioni MDM consentono di ottenere questo risultato. È possibile semplificare notevolmente l'utilizzo eliminando l'infrastruttura e fornendo MDM come servizio ai tuoi domini. Se si usa una soluzione centrale, applicare visualizzazioni separate per ogni singolo dominio o ambito.
Ottenere coerenza con i componenti riutilizzabili
La condivisione del codice è un altro modo per garantire la collaborazione e la riutilizzabilità dei dati master. Anziché condividere i dati master, condividere il codice sottostante (frammenti e script) per generare output e promuovere un riutilizzo efficace. Archiviare questo codice sottostante in un repository centrale e aperto con il controllo della versione. Tutti i team possono contribuire e migliorare il codice presente in questo repository.
In questo modello si applica la logica di business solo all'interno dei domini. I team possono deviare, apportare miglioramenti o usare versioni leggermente ottimizzate della logica in base alle esigenze. È possibile rigenerare gli output man mano che i miglioramenti della community vengono aggiunti al repository di codice centrale.
Si noti che consentire ai team di modificare il codice può rendere più difficile confrontare i risultati tra vari team, che possono influire sulla coerenza.
Riepilogo della gestione dei dati master
Gli utenti possono prendere decisioni corrette solo se i dati usati sono coerenti e corretti. Usando MDM, è possibile garantire la coerenza e la qualità dei dati a livello aziendale.
La tua organizzazione deve trovare il corretto equilibrio per MDM. La presenza di troppe aree di dati master o valori di riferimento comporta un numero eccessivo di allineamento tra domini. L'assenza di dati aziendali rende impossibile confrontare i risultati. Un modo pratico per iniziare a usare MDM in modo bilanciato consiste nell'implementare un repository. Questo è il modo più semplice per gestire i dati master dell'organizzazione. Con un repository, non è necessario modificare i sistemi di dominio per apprendere quali dati sono di bassa qualità o devono essere allineati. Con un repository che consente di ottenere queste informazioni, è possibile offrire valore più rapidamente.
Dopo aver implementato un repository, è necessario delineare un ambito chiaro. Non cadere nella trappola dell'unificazione dei dati aziendali selezionando tutti i dati. Solo i dati master dei campi più importanti. Per iniziare, selezionare gli argomenti che aggiungono il maggior valore, ad esempio clienti, contratti, prodotti e unità organizzative. Il numero di attributi dovrebbe essere nelle decine, non nelle centinaia o migliaia.
Allineare i processi e la governance dopo aver stipulato un contratto con i domini. Rendere chiari tutti gli accordi sulle tempistiche e le revisioni a tutti i domini. Assicurarsi inoltre di lavorare sui metadati. Cataloga i dati principali. Assicuratevi che i vostri domini sappiano quali elementi di dati sono candidati dai quali sistemi di origine e come questi elementi fluiscono attraverso le vostre pipeline di dati.
Il passaggio finale, e il vostro obiettivo finale, è raggiungere la coesistenza. I miglioramenti dovrebbero fluire direttamente nei vostri domini. Questa è la parte più difficile del processo perché richiede di apportare molte modifiche all'architettura. I domini devono essere in grado di gestire correzioni e miglioramenti inviati dalla soluzione MDM gestita centralmente.