Il Data Mesh secondo Denodo
Nel corso di un webinar organizzato dalla società è stata enfatizzata l’importanza della virtualizzazione dei dati quale primo passo per sfruttare appieno le potenzialità di questo nuovo paradigma.
Ottenere informazioni e prendere decisioni a partire da dati che continuano a crescere in numero, volume e varietà delle fonti è sempre un tema di grande attualità. Nel 2019 Zhamak Dehgani, della società di consulenza Thoughtworks, ha proposto un nuovo paradigma: il data mesh. Di che cosa si tratta e, soprattutto, come realizzarlo? A queste domande ha risposto Paul Moxon, SVP data architecture & chief evangelist di Denodo, società attiva nel settore della gestione dei dati, nel corso di un webinar dedicato. Gli approcci tradizionali – quali data warehouse e data lake – prevedono di centralizzare in un’unica fonte monolitica tutti i dati aziendali, ma in un contesto sempre più complesso e imprevedibile come quello attuale questo significa scarsa flessibilità e provisioning lento dei dati poiché le piattaforme centralizzate sono configurate per eseguire operazioni standard a ogni livello. “Il data mesh propone di sostituire l’unica origine di dati centralizzata con più domini di dati, ciascuno gestito dai diversi dipartimenti aziendali”, ha spiegato Moxon. “Uno dei concetti chiave dell’approccio data mesh è ‘data as a product’, vale a dire considerare il dato come un prodotto accessibile, fruibile e comprensibile da tutti”.
Partire dalla virtualizzazione dei dati
Ma da dove partire per realizzare un data mesh? Innanzitutto, è necessario disporre di un sistema di consegna dei dati in grado di affrontare la sua natura intrinsecamente distribuita. Gli approcci ETL tradizionali non sono in grado di eseguire questa funzione perché sono progettati per spostare i dati da più origini a un unico repository. La virtualizzazione dei dati, al contrario, è perfetta per un data mesh: a differenza dei processi ETL, infatti, fornisce accesso in tempo reale ai dati senza doverli replicare. Un’architettura basata sulla virtualizzazione dei dati abilita la realizzazione di un ambiente data mesh in quanto gli unici dati centralizzati sono i metadati critici per l’accesso alle diverse origini dei dati. La virtualizzazione dei dati consente inoltre di implementare protocolli di governance e sicurezza da un unico punto di controllo e di costruire modelli semantici altamente personalizzati al di sopra delle singole origini dei dati che possono essere facilmente rivisitati senza modificare i dati sottostanti. Virtualizzare consente di realizzare cataloghi completi che elencano i dati come ‘prodotti’ e forniscono un accesso rapido agli stessi in modalità self-service.