Was ist Data Governance und warum brauchen Sie das?
In einem schnelllebigen und hart umkämpften Umfeld ist Data Governance eine zentrale Anforderung. Jetzt, da Unternehmen die Möglichkeit haben, enorme Mengen unterschiedlicher interner und externer Daten zu erfassen, brauchen sie ein Konzept, um den Wert dieser Daten gezielt zu maximieren, mögliche Risiken effektiv zu steuern und Kosten zu reduzieren.
Was ist Data Governance?
Data Governance ist eine Ansammlung von Prozessen, Rollen, Richtlinien, Standards und Kennzahlen, die eine effektive Nutzung von Informationen ermöglichen und Organisationen bei der Umsetzung ihrer Ziele unterstützen. Data Governance umfasst die Prozesse und Verantwortlichkeiten, die für die Qualität und Sicherheit der in einem Unternehmen oder in einer Organisation genutzten Daten relevant sind. Unternehmen können damit festlegen, wer welche Daten in welchen Situationen und mit welchen Methoden nutzen kann.
Eine gut durchdachte Data Governance-Strategie unterstützt einheitliche, standardmäßige Prozesse und Verantwortlichkeiten und ist für jede Organisation, die mit Big Data arbeitet, von großer Bedeutung. Business-Driver zeigen auf, welche Daten im Rahmen Ihrer Data Governance-Strategie einer sorgfältigen Kontrolle bedürfen und welche Vorteile eine solche Initiative voraussichtlich bietet. Diese Strategie bildet die Basis Ihres Data Governance-Frameworks.
Ein möglicher Business-Driver für Ihre Data Governance-Strategie könnte der Schutz gesundheitsbezogener Daten sein: Hier kommt es darauf an, Patientendaten in Ihrem Unternehmen auf sichere Weise zu verwalten. Dabei müssen Aufbewahrungspflichten (z. B. Nachvergolgung wer welche Informationen wann geändert hat) definiert werden, um die Einhaltung relevanter gesetzlicher Anforderungen wie der DSGVO sicherzustellen.
Eine Data Governance-Strategie sorgt dafür, dass datenbezogene Rollen und Verantwortlichkeiten im gesamten Unternehmen klar definiert werden. Ein gut durchdachtes Data Governance-Framework deckt strategische, taktische und operative Rollen und Verantwortlichkeiten ab.
Was Data Governance NICHT ist
Data Governance wird häufig mit anderen, eng zusammenhängenden Begriffen und Konzepten verwechselt, darunter Datenmanagement und Stammdatenmanagement.
Data Governance ist nicht Datenmanagement
Beim Datenmanagement geht es um die Verwaltung des gesamten Lebenszyklus von Daten innerhalb einer Organisation. Data Governance ist die zentrale Komponente des Datenmanagements, das neun weitere Konzepte miteinander verknüpft, darunter Datenqualität, Referenz- und Stammdatenmanagement, Datensicherheit, Datenbankprozesse, Metadatenmanagement und Data Warehousing.
Data Governance ist nicht Stammdatenmanagement
Das Stammdatenmanagement (Master Data Management, MDM) konzentriert sich darauf, wichtige Bereiche einer Organisation zu identifizieren und anschließend die Qualität dieser Daten zu verbessern. Es stellt sicher, dass Sie die vollständigsten und genauesten verfügbaren Informationen zu wichtigen Bereichen wie Kunden, Auftragnehmer, medizinische Dienstleister etc. haben. Da diese Bereiche organisationsweit von Bedeutung sind, geht es beim Stammdatenmanagement darum, fragmentierte Ansichten dieser Einheiten in einer zentralen Ansicht abzugleichen – ein Konzept, das über Data Governance hinausgeht.
Allerdings kann das Stammdatenmanagement ohne solide Governance nicht erfolgreich funktionieren. Ein Data Governance-Programm definiert zum Beispiel die Stammdatenmodelle (was ist die Definition eines Kunden, eines Produkts, etc.), legt die Aufbewahrungsrichtlinien für Daten fest, und definiert die Rollen und Verantwortlichkeiten für Data Authoring, Datenkuratierung und Zugriff.
Data Governance ist nicht Data Stewardship
Data Governance sorgt dafür, dass die richtigen Personen die richtigen Datenverantwortlichkeiten zugewiesen bekommen. Data Stewardship bezeichnet die erforderlichen Tätigkeiten, mit denen sichergestellt wird, dass die Daten genau, unter Kontrolle und von den entsprechenden Benutzergruppen einfach zu finden und zu verarbeiten sind. Bei Data Governance geht es vor allem um die Strategie, Rollen, Organisation und Richtlinien, während bei Data Stewardship die Ausführung und Operationalisierung im Vordergrund stehen.
Data Stewards kümmern sich um Datenressourcen, stellen sicher, dass die vorliegenden Daten dem Data Governance-Plan entsprechen, mit anderen Datenressourcen verknüpft sind und hinsichtlich der Datenqualität, Compliance oder Sicherheit unter Kontrolle sind.
Vorteile von Data Governance
Eine effektive Data Governance-Strategie bietet zahlreiche Vorteile, darunter:
- Gemeinsames Verständnis der Daten – Data Governance ermöglicht eine einheitliche Sicht auf die Daten sowie eine einheitliche Terminologie dafür. Die einzelnen Geschäftseinheiten behalten dabei ein angemessenes Maß an Flexibilität.
- Verbesserte Datenqualität – Ein gut durchdachter Data Governance-Plan stellt die Genauigkeit, Vollständigkeit und Konsistenz der Daten sicher.
- Data Map – Data Governance sorgt dafür, dass der Standort kritischer Unternehmensdaten jederzeit genau bekannt ist – eine wichtige Voraussetzung für die Datenintegration. Wie ein GPS, das eine physische Landschaft abbildet und den Nutzern dabei hilft, sich in einer unbekannten Gegend zurechtzufinden, sorgt Data Governance dafür, dass Daten geschäftsrelevante Erkenntnisse liefern und effizient genutzt werden können.
- Eine 360-Grad-Sicht auf alle Kunden und andere Geschäftseinheiten – Mithilfe von Data Governance können sich Organisationen auf „eine einzige Version der Wahrheit“ für zentrale Geschäftseinheiten verständigen und anschließend ein geeignetes Maß an Einheitlichkeit über verschiedene Einheiten und Geschäftsaktivitäten hinweg schaffen.
- Durchgehende Compliance – Data Governance ermöglicht die Einhaltung gesetzlicher Vorgaben, wie z. B. DSGVO (EU-Datenschutz-Grundverordnung), US-HIPAA (Health Insurance Portability and Accountability Act) und branchenspezifischer Anforderungen wie PCI-DSS (Payment Card Industry Data Security Standards).
- Besseres Datenmanagement – Data Governance bringt eine menschliche Dimension in hochautomatisierte, datenorientierte Umgebungen. Unternehmen können damit Verhaltensregeln und Best Practices für das Datenmanagement definieren und sicherstellen, dass Bedenken und Anforderungen, die über traditionelle Daten- und Technologiebereiche hinausgehen – wie etwa Recht, Sicherheit und Compliance –, konsequent berücksichtigt werden.
Cloud-Data Governance
Da sich immer mehr Unternehmen und Organisationen die Vorteile der teilweisen oder vollständigen Migration ihrer Datenspeicher und -prozesse zu Cloud-Integrationen und iPaaS zunutze machen, nimmt auch der Bedarf an einer effektiven Data Governance zu.
Bei der Migration in die Cloud geht es darum, bestimmte Aufgaben wie Infrastrukturmanagement, Anwendungsentwicklung, Sicherheit, etc. an Dritte abzugeben. Zudem steht die Cloud auch für die Virtualisierung technischer Ressourcen. Hier können sich Herausforderungen in Bezug auf die Datenhoheit ergeben, z. B. in Form von Bestimmungen, die vorschreiben, dass sich Daten an einem bestimmten Ort oder in einem bestimmten Land befinden müssen. Darüber hinaus fördern Cloud-first-Strategien generell eine Dezentralisierung, die verschiedenen Unternehmensbereichen oder Arbeitsgruppen erlaubt, eigene Systeme zu implementieren, was zu einer unkontrollierten Datenflut führen kann.
Hier kommt Governance ins Spiel. Erstens ist ein strategischer Data Governance-Plan entscheidend für die Migration von Inhalten in die Cloud. Egal, ob sich eine Organisation für ein hybrides oder komplett Cloud-basiertes Datenmodell entscheidet, profitiert die Datenmigration von den gleichen Vorteilen wie ein allgemeiner Data Governance-Plan und die Migration selbst wird effizienter und sicherer.
Zudem wird die Datenmigration in die Cloud was Sicherheit und Zugriff angeht zunehmend komplexer. Eine komplett lokale Datenlösung braucht zwar auch eine solide Data Governance-Strategie, aber wenn Daten in die Cloud verlagert werden, wissen die Beteiligten Data Governance besonders zu schätzen.
Data Governance-Tools
Um den richtigen Data Governance-Ansatz für Ihre Organisation zu finden, sollten Sie nach skalierbaren Open Source-Tools Ausschau halten, die sich schnell und wirtschaftlich in Ihre bestehende Umgebung integrieren lassen.
Cloud-basierte Plattformen bieten Ihnen einen schnellen Zugriff auf robuste, kosteneffiziente und benutzerfreundliche Funktionen. Außerdem entfällt bei Cloud-basierten Lösungen der Aufwand für lokale Server.
Bei der Auswahl Ihres Data Governance-Tools sollten Sie sich für eine Lösung entscheiden, die den geschäftlichen Nutzen unterstützt, den Sie mit Ihrer Data Governance-Strategie erreichen wollen.
Hier ein paar Tipps:
- Nutzen Sie Discovery-, Profiling- und Benchmarking-Tools und -Funktionen, um Ihre Daten zu erfassen und besser zu verstehen. Die richtigen Tools können zum Beispiel personenbezogene Daten wie etwa Sozialversicherungsnummern automatisch in neuen Datensätzen erkennen und einen entsprechenden Warnhinweis aktivieren.
- Verbessern Sie die Qualität Ihrer Daten durch Prüfung, Bereinigung und Anreicherung.
- Verwalten Sie Ihre Daten mit metadatenbasierten ETL und ELT-Prozessen sowie Datenintegrationsanwendungen, sodass die Datenherkunft in den Pipelines lückenlos zurückverfolgt werden kann.
- Steuern Sie Ihre Daten mit Tools, die eine aktive Überprüfung und Überwachung ermöglichen.
- Dokumentieren Sie Ihre Daten, sodass diese durch Metadaten ergänzt werden können, um die Relevanz, Durchsuchbarkeit, Zugänglichkeit, Verknüpfbarkeit und Compliance zu verbessern.
- Nutzen Sie Selfservice-Tools, um die Mitarbeiter, die sich am besten mit den Daten auskennen, an den Data Stewardship-Aufgaben zu beteiligen.
Talend kennt sich mit Data Governance aus und bietet nützliche Cloud-basierte Tools, mit denen große wie kleine Organisationen Data Governance aktiv umzusetzen können. Talends Datenqualitäts-, Daten- und Metadatenmanagement- und Data Stewardship-Tools sind robust und benutzerfreundlich, sodass Sie damit schnell und effektiv Ihre Data Governance-Anforderungen erfüllen können.
Data Governance ist keine Option
Organisationen haben heute riesige Mengen an Daten über ihre Kunden, Auftraggeber, Lieferanten, Patienten, Mitarbeiter, etc. Werden diese Informationen sinnvoll eingesetzt, um ein besseres Verständnis über den Markt und die relevanten Zielgruppen zu erlangen, trägt das zum Erfolg einer Organisation bei. Data Governance sorgt dafür, dass diese Daten relevante Vorgaben einhalten, verlässlich, gut dokumentiert, leicht auffindbar und abrufbar sind, und dass sie geschützt und vertraulich bleiben.
Sorgen Sie dafür, dass Ihre Organisation möglichst viel aus Ihren Data Governance-Investitionen herausholen und das Risiko von Datenpannen minimieren kann. Sehen Sie sich unsere Data Governance-Lösungen an, sobald Sie bereit für den ersten Schritt sind.
Sind Sie bereit, mit Talend durchzustarten?
Weitere Artikel zu diesem Thema
- Data Governance-Tools: Die besten Tools für Organisation, Zugriff und Schutz
- Data-Governance-Richtlinien – Definition & Beispiele
- Strukturierte vs. unstrukturierte Daten: ein Leitfaden
- Data Catalog – Definition, Funktionen und Tools
- Data Stewardship und die Einsatzbereiche von Data Stewards in Unternehmen
- Data Lineage: Management, Definition und Vorteile
- Metadaten – der strukturierte Weg aus dem Datenlabyrinth
- Obfuskation: Anonymisierung von Daten für mehr Schutz