Che cos'è la qualità dei dati?
La qualità dei dati è il processo di condizionamento dei dati per soddisfare le specifiche esigenze degli utenti aziendali. I dati sono la risorsa più preziosa di un'organizzazione ed eventuali decisioni basate su dati viziati possono avere effetti devastanti per l'azienda. Questo è il motivo per cui è fondamentale avere la sicurezza della qualità dei dati prima di condividerli con chiunque ne abbia bisogno.
L'impatto di una scarsa qualità dei dati
Le conoscenze che un'azienda può ricavare dai dati sono efficaci solo quanto la veridicità delle informazioni stesse. I dati di cattiva qualità possono provenire da qualsiasi settore dell'organizzazione e presentarsi in forme diverse, e possono portare a difficoltà di analisi e di conseguenza a decisioni non consone.
La qualità dei dati è fonte di preoccupazione per molti dirigenti d'azienda. Secondo il report "2016 Global CEO Outlook" di Forbes Insights e KPMG, l'84% dei quadri aziendali si preoccupa della qualità dei dati utilizzati per la business intelligence. La scarsa qualità può essere costosa: un sorprendente studio condotto da MIT Sloan ha quantificato al 15-25% del fatturato totale il potenziale costo di dati inadeguati.
Fortunatamente, questa non deve necessariamente essere sempre la realtà dei fatti. L'adozione delle sei metriche della qualità dei dati nelle procedure di raccolta delle informazioni promuove prestazioni ottimali dei sistemi aziendali e incrementa la fiducia degli utenti nell'affidabilità dei dati.
Definizione delle aspettative di qualità dei dati
Indipendentemente da dimensioni, funzioni o mercati di destinazione, ogni organizzazione deve prestare attenzione alla qualità dei dati per comprendere il proprio business e prendere decisioni consone. Le tipologie e le sorgenti di dati sono estremamente numerose e la qualità influisce sulle operazioni aziendali in modo diverso a seconda degli utilizzi e delle finalità. Ecco perché bisogna definire aspettative esclusive e concordate in modo collaborativo per ciascuna delle sei metriche citate sopra, in base anche a ciò che l'azienda si aspetta di ricavare dai dati.
I dati assumono valore principalmente quando sono usati a sostegno di un processo aziendale o di una decisione basata sulla business intelligence. Pertanto, le regole di qualità concordate devono prendere in considerazione il valore che i dati possono fornire all'organizzazione. Se si identifica un valore molto elevato in un determinato contesto, questo può indicare che sono necessarie regole di qualità più rigorose in quel dato contesto. Le aziende devono quindi concordare gli standard di qualità in base non solo alla quantificazione della qualità (e naturalmente a tutti gli standard esterni che essa deve soddisfare), ma anche tenendo conto delle conseguenze della mancata osservanza di tali regole.
Quando si ignora la qualità dei dati
Il costo della mancanza di azioni sale in modo esponenziale nel tempo. La scarsa qualità dei dati può essere mitigata molto più facilmente se viene identificata prima dell'utilizzo, ossia al punto di origine. Assegnando un ipotetico costo di un dollaro alla verifica e/o standardizzazione dei dati al momento dell'immissione, prima che si raggiungano i sistemi di back-end, tale importo può salire a dieci dollari se si opta per la pulizia in un secondo momento, verificando le corrispondenze e risolvendo tutte le incoerenze nei diversi luoghi di utilizzo o memorizzazione. Lasciando invece dati inaffidabili nel sistema, usandoli per decisioni importanti, inviandoli ai clienti o presentandoli all'azienda, il costo ipotetico ammonterebbe a 100 dollari rispetto al dollaro inziale che si sarebbe speso per la verifica al punto di immissione. L'importo tende ad aumentare in funzione del tempo di permanenza di tali dati nel sistema. L'obiettivo è quindi individuare tutti i dati viziati prima che entrino nei sistemi aziendali.
Un approccio vincente per la qualità dei dati
Ogni azienda deve stabilire un approccio esaustivo, proattivo e collaborativo alla qualità dei dati. La qualità deve essere responsabilità di ogni team (non solo dei reparti tecnici) e parte integrante di ogni sistema; devono esserci regole e policy che impediscono ai dati non validi di entrare nell'elaborazione.
Sembra impossibile? Non lo è. Ecco una roadmap che indica come sviluppare questo approccio:
- Crea un team interdisciplinare. Recluta data architect, persone d'affari, data scientist ed esperti di protezione per costituire un core team responsabile della qualità dei dati. Deve essere gestito da un leader di implementazione, che svolga contemporaneamente la funzione di team coach e de promotore dei processi di qualità dei dati.
- Definisci le aspettative sin dall'inizio. Trova le risposte alle finalità della qualità dei dati tra gli esperti interpellati. Assicurati che tutti conoscano gli obiettivi e che questi abbiano un forte impatto sul business.
- Anticipa i cambiamenti legislativi e gestisci la conformità. Avvaliti del core team della qualità dei dati per formulare iniziative di conformità a breve termine, come per il regolamento GDPR. L'azienda acquisterà immediatamente valore a breve termine e visibilità strategica.
- Stabilisci obiettivi ambiziosi e di grande impatto. Quando stabilisci il piano per la qualità dei dati, non esitare a definire obiettivi coraggiosi e basati sul business. Il piano attrarrà l'attenzione del Consiglio di amministrazione e sfrutterà appieno le capacità delle persone.
- Persegui risultati rapidi. L'ottenimento di risultati rapidi inizia dal coinvolgimento dell'azienda nella gestione dei dati, con attività come l'onboarding dei dati, la migrazione più rapida dei dati nel cloud o la pulizia dei dati Salesforce.
- Agisci in modo realistico. Definisci e usa attivamente KPI misurabili accettati e compresi da tutti. La qualità dei dati è correlata alle attività aziendali, quindi potenzia i tuoi progetti usando indicatori basati sul business, come la redditività degli investimenti e il tasso di potenziamento dei risparmi.
- Celebra i successi. Al termine di un progetto con risultati misurabili, assicurati che tutte le parti interessate ne siano al corrente. È importante conseguire successi, ma è ancor più importante saperli comunicare con efficacia.
Gestione dei dati in tutta l'azienda
Un approccio proattivo alla qualità dei dati consente di verificare e misurare il livello di qualità prima che i dati arrivino al cuore dei sistemi. L'accesso e il monitoraggio dei dati nei sistemi interni, nel cloud, sul web e nelle applicazioni mobili sono un compito complesso; l'unico modo per implementare un tale livello di monitoraggio su tutti i sistemi in uso è tramite l'integrazione dei dati. Pertanto si rende necessario controllare la qualità dei dati in tempo reale.
Ovviamente, è essenziale evitare la propagazione dei dati errati inserendo regole di controllo nei processi di integrazione. Con dati integrati e i giusti strumenti per la verifica della qualità, si possono creare segnalatori che identificano alcune delle cause alla base dei problemi di qualità dei dati in generale. Poi si dovrà tenere traccia dei dati nell'intero panorama di applicazioni e sistemi in uso. Questo permette l'analisi sintattica, la standardizzazione e la corrispondenza dei dati in tempo reale. L’attività di verifica della correttezza dei dati può essere organizzata all'occorrenza.
L'utilizzo di dati inaffidabili ha un costo, che si concretizza in opportunità perse, decisioni inadeguate e tempo necessario per ricercare, pulire e correggere gli errori. La gestione collaborativa dei dati e gli strumenti per risolvere gli errori al punto di origine sono metodi efficaci per garantire la qualità dei dati per tutti coloro che se ne servono. Scopri le numerose app offerte da Talend Data Fabric per aiutare a conseguire questi obiettivi.