データの冗長性とは?
データの冗長性は、データベースやデータストレージのテクノロジーに同じデータが保持されている状態を指します。単一データベース内の2つの異なるフィールド、または複数のソフトウェアプラットフォーム/環境内の2つの異なるスポットでデータが再現されることがあります。データの冗長性は、意図せず発生することもありますが、バックアップやリカバリの目的で意図的に作り出されることもあります。
意図しないデータの冗長性は、非効率なコーディングやプロセスが複雑なためにデータが重複してしまった場合に発生することがあります。一方で、意図的なデータの冗長性は、データを保護して一貫性を促進するために起こることがあります。
データを複数の場所に格納すること自体は問題ありません。問題を回避するには、データには中央のマスターフィールド(スペース)が必要となります。これにより、単一のアクセスポイントでデータが冗長な場所をすべて更新できるようになります。このマスターフィールドがない場合、1か所で更新が行われても別のフィールドが自動的に更新されないため、このようなデータ冗長性はデータの一貫性を損ないます。同一であるはずのデータが異なる値を持つことになると、処理に問題が生じる可能性があります。
MDMによるデータ冗長性の低減
データの冗長性は、多くの組織で共通する問題です。ほとんどの大企業は、異種混在のアプリケーションポートフォリオを持ち、サイロ化された多様なアプリケーション内に不正確/不完全/不整合なデータが混在しています。データの冗長性は、しばしば一貫した顧客ビューを求める企業で発生し、このような場合には多数の運用システム間でデータを調整するのに苦労します。
たとえば、1人の顧客がシステムによって「Ms. Smith」と識別されたり「Theresa Smith」と識別されたりすることがあります。このような問題によってインテリジェントな意思決定が困難になりますが、問題解決は共有データの処理方法に関連するものとなります。
マスターデータ管理(MDM)は、重要なデータすべてを共通の関心ポイントを提供する単一の「マスターファイル」にリンクさせる包括的な手法です。マスターデータの例には、顧客、製品、資産、ロケーション、従業員、組織単位などがあります。
MDMは、共有データをより効率的に管理し、データの冗長性を排除し、むずかしい「データの一貫性」を実現する手段として浮上しています。データの一貫性と俊敏性の両方を提供できるMDMは、競争優位性とROI(投資対効果)を提供します。
コストの大幅な削減、コンプライアンスの報告義務の履行、売上増加、顧客とサプライヤーへの優れたサービスの提供を目指して、ビジネスは懸命に取り組んでいます。これらのビジネスの優先課題に大きく貢献するソリューションとして、アナリストはMDMを推進しています。
マスターデータ管理は、組織の非トランザクションデータエンティティを一貫した方法で定義・管理する一連のプロセスとツールで構成されます。その目的は、組織全体にデータを収集、集約、照合、統合、品質保証、永続化、分散するためのプロセスを提供して、この情報の継続的な保守とアプリケーションの使用における一貫性と制御を確実にすることです。
TalendのMDMソリューションによるデータ冗長性の問題解決
Talend MDMは、特定のビジネスニーズに容易に適応し、迅速に実装できる、モデル駆動型で非侵入型のソリューションです。データは、さまざまなシステムで多様な形式でホストされ、非常に揮発性が高い場合もあります。このようなデータを使用するあらゆるタイプの組織が、マスターデータの作成と管理という課題に取り組むために開発されたのが、Talend MDMです。
Talend MDMは、全社的なデータのマスタリング、管理、統合のための包括的な機能を提供します。企業のすべてのマスターデータは中央のハブにグループ化されます。データモデルの使用を通じて、この標準化されたリポジトリーがデータと更新の妥当性確認のための前提条件を提供します。
Talend MDMソリューションの重要な要素となるTalend Studioは、データの冗長性によって生じる問題の解決に特に適しています。Talend Studioが提供する処理レイヤーは、適切な人が適切なツールを使用して、マスターデータを一元的にモデル化して操作することを保証します。この重要機能は、マスターデータガバナンスとスチュワードシップに関連する機能を含みます。
データガバナンスは、マスターデータが準拠するルールを定義するプロセスです。データスチュワードシップは、データがルールに従っていることを確認するプロセスです。つまり、適切な制御が導入されていることを示すガバナンス機能と、制御が実施されることを確実にするためのスチュワードシップ機能の両方を使用する必要があります。
Talend Studioは、次のような機能を含みます。
- データプロファイリングとデータクオリティの機能:プロファイリングの観点から使用できます。MDMハブにロードする前のソースデータに対してプロファイリングとクレンジングを実行し、企業のマスターデータクオリティを高い水準で保証します。ユーザーはプロファイリングの観点から、MDMハブにロードする前の多様なソースのデータをプロファイリングし、クレンジングできます。
- マスターデータ管理機能:MDMの観点から使用できます。必要なビジネスルールとデータルールを使用してデータモデルを構築し、データの単一のマスターコピーを作成します。このデータが、ソースシステムとターゲットシステムに伝播されます。
- データ解決機能:Talend Data Stewardship Consoleを使用してTalend MDM Webユーザーインターフェイスで提供されます。異なるデータソースからのマッチング処理の後に到着したレコード、そしてゴールデンマスターデータレコードを得るために意思決定が必要とされるレコードを処理します。
データの量、ソースの数、データの種類が増えるにつれて、データの冗長性も高まり、データ駆動型企業の頭痛の種となっていきます。MDMソリューションは、データ冗長性の問題を緩和するために大きく貢献します。
Talendは、MDM向けのオープンソース製品を提供しています。今すぐお試しください。