Cos’è un Data mart e come differisce dal Data warehouse?

di Maxime Perotti il 23/11/20

Da una decina d’anni, la crescita vertiginosa dei dati prodotti ha accelerato lo sviluppo del big data. L’universo dello sviluppo applicativo e quello inerente la gestione dati hanno iniziato a convergere.

In questo contesto, è essenziale saper centralizzare, strutturare, elaborare e analizzare una massa di dati per un problema specifico: ecco lo scopo del data mart. Cosa copre esattamente questa nozione? In cosa diverge dal concetto di data warehouse?

Vediamolo insieme.

Cosa si intende per Data mart?

Definizione

Un datamart, anche noto come data store, è un raccoglitore di dati specifico per un determinato gruppo di utenti.

Utilizzato nella business intelligence, ecco i suoi principali passaggi:

  1. estrazione dei dati da sorgenti interne o esterne (o da entrambe),
  2. analisi ed elaborazione,
  3. caricamento nel repository del Data mart.

👆 I dati rimangono a disposizione per eventuali analisi future.

Schema di Data mart

© Talend

👉 Il datamart deve essere funzionale all’obiettivo finale. Per questo, occorre ritrascrivere nel modo più intelligibile possibile i dati inizialmente memorizzati nel Data warehouse.

Esempio di Data mart

Si può immaginare che all'interno dell'universo HR di un'impresa, un datamart principale fornisca tutte le informazioni in merito all'utilizzo dell'ERP principale, e che degli altri "mattoncini" siano dei datamart direttamente associati a software secondari e più specifici , come ad esempio quello per il follow up dei dipendenti.

I vantaggi del Data mart

  1. Offre ai suoi utenti un panel completo di tutti gli indicatori inerenti i dati di cui hanno bisogno nel quotidiano.
  2. Garantisce ad un certo gruppo di utenti l’accesso ad un singolo Data mart o a più Data mart, ciascuno corrispondente ad una specifica esigenza, a seconda delle architetture informatiche implementate e della riservatezza dei dati.

💡 L’obiettivo è costruire un database strutturato in funzione degli argomenti, così da ridurre sensibilmente i tempi per accedere alle informazioni pertinenti e rispondere alle esigenze specifiche delle varie aree aziendali.

Data mart vs Data warehouse: quali differenze?

Il Data warehouse può essere considerato come un insieme di Datamart e dei loro gateway. In altri termini, consiste in una centralizzazione in un unico sistema, volto a garantire la sicurezza, la disponibilità e la coerenza tecnica di tutti i dati per l'utilizzo dei Data mart.

Di conseguenza, riveste un aspetto più tecnico e non è composto dal solo campo “Fatturato”, bensì da più componenti del reddito e delle spese da stabilire a seconda della concezione di ricavo di ogni dipartimento.

Il Data warehouse permette poi di assicurare la tracciabilità delle informazioni nell’intera organizzazione, a differenza del Data mart che si limita a soddisfare le specifiche necessità di un mestiere.

Come costruire un Data mart? 3 opzioni

Il Data mart integrato ad un’applicazione sorgente

Se privilegiate i Data mart di questo tipo, è probabilmente perché l’applicativo stesso propone degli strumenti di analisi integrati. Questa vi sembra quindi la soluzione ideale.

Vantaggio: far sì che i dati si avvicinino il più possibile alle esigenze dell'applicazione e assicurare la coerenza tra i dati e la loro produzione.

Svantaggi:

  • dei costi a medio e lungo termine, poiché non si ha il controllo sulla rendicontazione degli indicatori;
  • una più complessa integrazione con i dati in vostro possesso, e viceversa;
  • un difficile reinserimento dei dati all’interno del Data warehouse.

👉 Ciò che avrete guadagnato in velocità di realizzazione, rischiate di perderlo nel mancato sfruttamento delle potenzialità.

Il Data mart indipendente dal Data warehouse

Si tratta di una versione più sofisticata. Può essere implementato in interno, ma sempre a partire da una specifica fonte, da cui è strettamente dipendente.

Vantaggio: un maggior margine di manovra sugli elementi di restituzione.

Svantaggio: la mancata integrazione con il restante database inficia sulla vostra capacità di risposta ai bisogni degli utenti a medio termine.

Il Datamart come pilastro del Data warehouse

Per realizzare appieno il loro potenziale, i Data mart devono articolarsi attorno ad un Data warehouse. La loro integrazione può essere:

  • ↗️ ascendente: un insieme di Data mart volti a costituire un Data warehouse,
  • ↘️ discendente: la centralizzazione dei dati nel Data warehouse, permette di creare tutte le parti necessarie.

Vantaggi:

  • un miglior collegamente con gli altri processi aziendali, per spiegare con maggior precisione gli indicatori chiave della vostra performance. Ad esempio:
    • evidenziare una correlazione tra i risultati in calo su un particolare ambito della vostra piattaforma e-learning e un aumento di incidenti su una catena di produzione.
    • ottimizzare il vostro tasso di produzione in base all'analisi del flusso svolto per mezzo di uno strumento CRM.
  • La disposizione di questi mattoni all'interno o intorno a un datawarehouse aumenta le possibilità di garantire la corretta interpretazione dei vostri indicatori in un uso interfunzionale.

Svantaggio: Una minor indipendenza.

Quale software scegliere?

I software ETL vi permettono di analizzare un notevole quantitativo di dati in maniera rapida ed efficiente.

Esistono poi alcune soluzioni di archiviazione documenti, open source o proprietarie, che vi permettono di gestire al meglio il vostro Data mart.

☝️La scelta tra open-source e software proprietario deve avvenire in base alla capacità interna di sviluppo software.

La transizione da Data mart a DataOps

L’integrazione dei Data mart in un Data warehouse dev’essere un obiettivo centrale.

Poiché i tecnici sono sommersi da un gran numero di domande, e ci si attende da loro grande reattività, si è reso necessario prendere a prestito dall’universo applicativo le tecniche di integrazione continua. Così oggi, l’ingegneria dei dati deve interfacciarsi con un nuovo paradigma: il DataOps, derivato dal metodo DevOps.

In sostanza, l’adattamento dei principi DevOps al mondo dei dati, apporta una nuova risposta alle sfide legate all’implementazione dei Data mart in un contesto di forte crescita.

Traduzione di un articolo pubblicato su appvizer.fr da Laurent Hercé, esperto di IT, HR, Social Selling, Cloud computing, SaaS e innovazione.