WHAT
データ・カタログとは
データカタログは、メタデータを使用して、組織内のすべてのデータ資産の有益で検索可能なインベントリーを作成します。これらの資産には、以下が含まれます。構造化(表形式)データ、文書、Webページ、Eメール、ソーシャル・メディア・コンテンツモバイル・データ、画像、音声、動画などの非構造化データ、レポートとクエリ結果、データの可視化とダッシュボード機械学習モデル、データベース間の接続。このインベントリーにより、 データ市民data citizen:企業データへのアクセス権を持つデータ・アナリスト、データサイエンティスト、データ・スチュワード、その他のデータの専門家)は組織で利用可能なすべてのデータ資産を検索し、分析またはビジネスの目的に応じて最適なデータを自由に見つけることができるようになります。
データ・カタログには通常、それぞれの資産の適切な特定、評価、使用を容易にするために各データ資産と関係付けられたメタデータを収集し継続的に拡充する、つまり キュレートする機能が含まれています。
また、ユーザーが以下を実行できるようにするツールも用意されています。
・カタログを検索する
・ユーザーが特に検索しなかったが、潜在的に関連のあるデータの検出を自動化する
・業界または政府の規制に準拠してデータの使用を管理する

TOOL CONSIDERATION
ツールを選択する際の考慮点
データ・カタログ・ソリューションを評価する
5つのポイント
データ・カタログの作成には、ソフトウェアとデータ市民の時間と労力への多額の投資が必要です。ほとんどの企業は、このような投資は一度しかしたくないと思います。そのためには、 データ・カタログ・ソリューションを評価する際に、以下のポイントを注意しなければなりません。
1.優れたデータのディスカバリー
データ・カタログの目的は、すべてのデータ市民が必要なデータを自分で使用できるようにすることです。 誰もが検索するメタデータに基づいて結果を素早く見つけ、他のユーザーによる評価やレビューに基づいて関連性のある推奨事項や警告を受け取ることができることが理想です。
2.コンプライアンス対応
人間の能力では、データのコンプライアンスを維持することはほとんど不可能です。データ・カタログでは、データ資産をプロファイルし、特定の規制との関連性を推測し将来の参照のためにそれらを自動的に分類してタグ付けすることにより、コンプライアンスを簡素化すべきです。 この場合、機械学習機能を活用することで作業を大幅に簡素化できます。
3.オールデータベースへの接続
企業全体のデータ資産を機能させるには、データ・カタログを企業内のすべての資産に接続する必要があります。 現在所有しているすべての種類の資産への接続と、今後の接続を構築するための取り組みを考慮します。また、オンプレミス、 パブリッククラウド、プライベートクラウド、 ハイブリッドクラウド、 ハイブリッド・マルチクラウド環境など、いずれにデータを保存しているのかにかかわらずデプロイ可能なカタログの導入を考慮します。
4.信頼できるデータを保証する仕組み
データ・カタログは、データ品質ルール、ビジネス用語集、ワークフローなどをツールとシームレスに統合できなければなりません。
5.運用サポート
使用されるデータだけでなく、さまざまな入力が意思決定と結果に与える影響を運用する必要がありAIモデルの管理が運用サポートの一部になりつつあります。 選択したデータカタログツールがデータ資産のタグ付けその他の準備をサポートして、AIがデータの最適な使用と透明性を実現するのを確認します。
WHAT SERVICE
データカタログ導入のワンストップサービス
全ての社内データを集中管理する仕組みの構築
データカタログ導入サービスでは、利用者によるデータの活用を促進するために、全ての社内データを集中管理する仕組みを構築いたします。データの発生元やデータ定義、導出方法などデータに関する情報を管理することで、利用者が分析の素材となるデータセットをデータソース(データ連携元や加工元)の名前やテーブル名、項目名、データの意味などのメタデータをもとに検索し自社のメタデータ内(データストア層/DWH層/データマート層など)のどこにデータがあるかを見つけることができます。
また、データ資産を適切に活用できるように統制・管理するとともに、品質やメタ情報を整備することで、システム横断のデータ配置や来歴及び影響範囲などの流れを把握し、システム開発・運用に役立てることが可能です。本サービスは、導入コンサルティングからデータカタログ構築、システム間の連携設定、導入後のシステム運用・保守までワンストップにてご提供できます。
