La governance dei dati è un sistema per definire chi all’interno di un’organizzazione ha autorità e controllo sugli asset di dati e come possono essere utilizzati tali asset di dati. Comprende le persone, i processi e le tecnologie necessarie per gestire e proteggere le risorse di dati. Il Data Governance Institute la definisce come “un sistema di diritti decisionali e responsabilità per i processi relativi alle informazioni, eseguito secondo modelli concordati che descrivono chi può intraprendere quali azioni con quali informazioni e quando, in quali circostanze, utilizzando quali metodi.” La Data Management Association (DAMA) International la definisce invece come “pianificazione, supervisione e controllo sulla gestione dei dati e sull’uso dei dati e delle fonti relative ai dati”.

Governance dei dati vs. gestione dei dati

La governance dei dati è solo una parte della disciplina generale (sebbene importante) della gestione dei dati. Mentre la governance dei dati riguarda i ruoli, le responsabilità e i processi per garantire la responsabilità e la proprietà delle risorse di dati, DAMA definisce la gestione dei dati come “un termine generale che descrive i processi utilizzati per pianificare, specificare, abilitare, creare, acquisire, mantenere, utilizzare, archiviare, recuperare, controllare ed eliminare i dati.”

Sebbene la gestione dei dati sia diventato un termine comune, a volte viene definita gestione delle risorse dati o gestione delle informazioni aziendali (EIM). Gartner descrive l’EIM come “una disciplina integrativa per strutturare, descrivere e governare le risorse informative oltre i confini organizzativi e tecnici per migliorare l’efficienza, promuovere la trasparenza e consentire la comprensione del business”.

Framework della governance dei dati

La governance dei dati può essere meglio pensata come una funzione che supporta la strategia globale di gestione dei dati di un’organizzazione. Tale framework fornisce alla vostra organizzazione un approccio olistico alla raccolta, gestione, protezione e archiviazione dei dati. Per aiutare a capire cosa dovrebbe coprire un framework, DAMA prevede la gestione dei dati come una ruota, con la governance dei dati descritta come un mozzo da cui si irradiano le seguenti 10 aree di conoscenza della gestione dei dati:

  • Architettura dei dati: la struttura complessiva dei dati e delle risorse relative ai dati come parte integrante dell’architettura aziendale
  • Modellazione e progettazione dei dati: analisi, progettazione, costruzione, test e manutenzione
  • Archiviazione e operazioni dei dati: distribuzione e gestione dell’archiviazione delle risorse di dati fisiche strutturate
  • Sicurezza dei dati: garantire la privacy, la riservatezza e un accesso appropriato
  • Integrazione e interoperabilità dei dati: acquisizione, estrazione, trasformazione, spostamento, consegna, replica, federazione, virtualizzazione e supporto operativo
  • Documenti e contenuti: archiviazione, protezione, indicizzazione e accesso ai dati trovati in origini non strutturate e messe a disposizione di questi dati per l’integrazione e l’interoperabilità con i dati strutturati
  • Dati di riferimento e principali: gestione dei dati condivisi per ridurre la ridondanza e garantire una migliore qualità dei dati attraverso la definizione e l’uso standardizzati dei valori dei dati
  • Data warehousing e business intelligence (BI): gestione dell’elaborazione dei dati analitici e accesso ai dati di supporto decisionale per il reporting e l’analisi
  • Metadati: raccolta, categorizzazione, manutenzione, integrazione, controllo, gestione e distribuzione di metadati
  • Qualità dei dati: definizione, monitoraggio, mantenimento dell’integrità dei dati e miglioramento della qualità dei dati

Quando si stabilisce una strategia, è necessario considerare ciascuno degli aspetti di raccolta, gestione, archiviazione e utilizzo dei dati di cui sopra. Il Business Application Research Center (BARC) avverte che, essendo la governance dei dati un programma molto complesso e continuo, chi vuole attuarla potrebbe perdere fiducia e interesse nel tempo. Per contrastare ciò, BARC consiglia di iniziare con un progetto prototipo gestibile o specifico per l’applicazione e quindi di espandersi in tutta l’azienda sulla base delle lezioni apprese.

BARC consiglia i seguenti passaggi per l’implementazione:

  • Definire gli obiettivi e comprendere i vantaggi
  • Analizzare lo stato attuale e l’analisi delta
  • Creare una tabella di marcia
  • Convincere le parti interessate e il progetto di bilancio
  • Sviluppare e pianificare il programma di governance dei dati
  • Attuare il programma di governance dei dati
  • Monitorare e controllare

Obiettivi della governance dei dati

L’obiettivo è stabilire metodi, set di responsabilità e processi per standardizzare, integrare, proteggere e archiviare i dati aziendali. Secondo BARC, gli obiettivi chiave di un’organizzazione dovrebbero essere:

  • Ridurre al minimo i rischi
  • Stabilire regole interne per l’utilizzo dei dati
  • Implementare i requisiti di conformità
  • Migliorare la comunicazione interna ed esterna
  • Aumentare il valore dei dati
  • Facilitare l’amministrazione di quanto sopra
  • Ridurre i costi
  • Contribuire a garantire la continuità dell’esistenza dell’azienda attraverso la gestione e l’ottimizzazione del rischio

BARC osserva che tali programmi abbracciano sempre i livelli strategico, tattico e operativo delle aziende e che devono essere trattati come processi iterativi continui.

big data

Vantaggi della governance dei dati

La maggior parte delle aziende dispone già di una qualche forma di governance per singole applicazioni, unità aziendali o funzioni, anche se i processi e le responsabilità sono informali. In pratica, si tratta di stabilire un controllo sistematico e formale su questi processi e queste responsabilità. Ciò può aiutare le aziende a rimanere reattive, soprattutto quando crescono a una dimensione in cui non è più efficiente per le persone svolgere attività interfunzionali. Molti dei vantaggi complessivi della gestione dei dati possono essere realizzati solo dopo che l’azienda ha stabilito una governance sistematica dei dati. Alcuni di questi vantaggi includono:

  • Supporto decisionale migliore e più completo derivante da dati coerenti e uniformi in tutta l’organizzazione
  • Regole chiare per la modifica di processi e dati che aiutano l’azienda e l’IT a diventare più agili e scalabili
  • Costi ridotti in altre aree della gestione dei dati grazie alla fornitura di meccanismi di controllo centrale
  • Maggiore efficienza grazie alla capacità di riutilizzare processi e dati
  • Maggiore fiducia nella qualità dei dati e nella documentazione dei processi di dati
  • Migliore conformità alle normative sui dati

Principi di governance dei dati

Secondo il Data Governance Institute, otto principi sono al centro di tutti i programmi di gestione e gestione dei dati di successo:

  • Tutti i partecipanti devono avere integrità nei loro rapporti reciproci. Devono essere sinceri e disponibili nel discutere i driver, i vincoli, le opzioni e gli impatti per le decisioni relative ai dati.
  • I processi di governance e gestione dei dati richiedono trasparenza. Deve essere chiaro a tutti i partecipanti e revisori come e quando le decisioni ei controlli relativi ai dati sono stati introdotti nei processi.
  • Le decisioni, i processi e i controlli relativi ai dati soggetti alla governance dei dati devono essere verificabili. Devono essere accompagnati da documentazione a supporto dei requisiti di verifica operativa e basati sulla conformità.
  • Devono definire chi è responsabile delle decisioni, dei processi e dei controlli interfunzionali relativi ai dati.
  • Devono definire chi è responsabile delle attività di gestione che sono responsabilità dei singoli contributori e dei gruppi di amministratori dei dati.
  • I programmi devono definire le responsabilità in modo da introdurre controlli ed equilibri tra i team business e tecnologici e tra coloro che creano/raccolgono informazioni, coloro che le gestiscono, coloro che le utilizzano e coloro che introducono standard e requisiti di conformità.
  • Il programma deve introdurre e supportare la standardizzazione dei dati aziendali.
  • I programmi devono supportare attività di gestione delle modifiche proattive e reattive per i valori dei dati di riferimento e la struttura / utilizzo dei dati master e dei metadati.

Ruoli per la governance dei dati

Ogni azienda compone la propria governance dei dati in modo diverso, ma ci sono alcuni punti in comune.

Comitato direttivo

I programmi di governance partono generalmente da un comitato direttivo composto da alti dirigenti, spesso individui di livello C o vicepresidenti responsabili delle linee di business. Morgan Templar, autore di Get Governed: Building World Class Data Governance Programs, afferma che le responsabilità dei membri del comitato direttivo includono la definizione della strategia di governance globale con risultati specifici, la promozione del lavoro dei data steward e la responsabilità dell’organizzazione di governance rispetto alle tempistiche e ai risultati.

machine learning

Titolare dei dati

Templar afferma che i proprietari dei dati (data owner) sono individui responsabili nel garantire che le informazioni all’interno di un dominio di dati specifico siano governate attraverso i sistemi e le linee di business. Sono generalmente membri del comitato direttivo, anche se potrebbero non essere membri votanti. I titolari dei dati sono responsabili di:

  • Approvare i glossari dei dati e altre definizioni dei dati
  • Garantire l’accuratezza delle informazioni in tutta l’azienda
  • Attività dirette di qualità dei dati
  • Revisione e approvazione degli approcci, dei risultati e delle attività di gestione dei dati master
  • Collaborare con altri proprietari di dati per risolvere i problemi relativi ai dati
  • Revisione di secondo livello per i problemi identificati dai data steward
  • Fornire al comitato direttivo input su soluzioni software, politiche o requisiti normativi del proprio dominio di dati

Data steward

I data steward sono responsabili della gestione quotidiana dei dati. Sono esperti in materia che comprendono e comunicano il significato e l’uso delle informazioni, afferma Templar, e lavorano con altri amministratori dei dati all’interno dell’organizzazione come organo di governo per la maggior parte delle decisioni sui dati. I data steward sono responsabili di:

  • Identificare problemi relativi ai dati e collaborazione con altri amministratori dei dati per risolverli
  • Agire come membri del consiglio di amministrazione dei dati
  • Proporre, discutere e votare le politiche sui dati e le attività dei comitati
  • Segnalare al proprietario dei dati e ad altre parti interessate all’interno di un dominio di dati
  • Lavorare in modo interfunzionale attraverso le linee di business per garantire che i dati del proprio dominio siano gestiti e compresi

Strumenti di governance dei dati

La governance dei dati è un programma in corso piuttosto che una soluzione tecnologica, ma ci sono strumenti che possono aiutare a supportare quel programma. Lo strumento più adatto alla vostra azienda dipenderà dalle vostre esigenze, dal volume di dati e dal budget. Secondo IT Central Station, alcune delle soluzioni più popolari includono:

  • Collibra Governance: Collibra è una soluzione a livello enterprise che automatizza molte attività di governance e amministrazione. Include un gestore delle politiche, un helpdesk dati, un dizionario dati e un glossario aziendale.
  • SAS Data Management: costruito sulla piattaforma SAS, SAS Data Management fornisce una GUI basata sui ruoli per la gestione dei processi e include un glossario aziendale integrato, SAS e gestione dei metadati di terze parti e visualizzazione della derivazione.
  • erwin Data Intelligence (DI) per la governance dei dati: erwin DI combina il catalogo dei dati e le capacità di alfabetizzazione dei dati per fornire consapevolezza e accesso alle risorse di dati disponibili. Fornisce inoltre indicazioni sull’utilizzo di tali risorse di dati e garantisce il rispetto delle politiche e delle best practice relative ai dati.
  • Informatica Axon: Informatica Axon è un hub di raccolta e un mercato di dati per i programmi di supporto. Le caratteristiche principali includono un glossario aziendale collaborativo, la capacità di visualizzare la derivazione dei dati e generare misurazioni della qualità dei dati in base alle definizioni aziendali.
  • SAP Data Hub: SAP Data Hub è una soluzione di orchestrazione dei dati pensata per aiutarti a scoprire, perfezionare, arricchire e governare tutti i tipi, varietà e volumi di dati nel tuo panorama di dati. Aiuta le organizzazioni a stabilire impostazioni di sicurezza e criteri di controllo dell’identità per utenti, gruppi e ruoli, nonché a semplificare le migliori pratiche e processi per la gestione dei criteri e la registrazione della sicurezza.
  • Alation: Alation è un catalogo di dati aziendali che indicizza automaticamente i dati in base all’origine. Una delle sue feature chiave, TrustCheck, fornisce una guida in tempo reale ai flussi di lavoro. Destinato specificamente a supportare l’analisi self-service, TrustCheck allega linee guida e regole alle risorse di dati.
  • Varonis Data Governance Suite: la soluzione Varonis automatizza le attività di protezione e gestione dei dati sfruttando un Metadata Framework scalabile che consente alle organizzazioni di gestire l’accesso ai dati, visualizzare gli audit trail di ogni file, identificare la proprietà dei dati in diverse unità aziendali e trovare e classificare i dati sensibili e documenti.
  • IBM Data Governance: IBM Data Governance sfrutta il machine learning per raccogliere e curare le risorse di dati. Il catalogo dati integrato aiuta le aziende a trovare, curare, analizzare, preparare e condividere i dati.

Certificazioni della governance dei dati

La governance dei dati è un sistema, ma esistono alcune certificazioni che possono aiutare la vostra organizzazione a ottenere un vantaggio, tra cui:

  • DAMA Certified Data Management Professional (CDMP)
  • Data Governance and Stewardship Professional (DGSP)
  • edX Enterprise Data Management
  • SAP Certified Application Associate – SAP Master Data Governance