2022年12月31日 更新

DWH(データウェアハウス)とは?他システムとの違い・活用事例を解説

DWHとは、企業内の複数システムから膨大なデータを蓄積するシステムのこと。ビッグデータの活用が求められる企業にとって、情報やデータ分析に不可欠なツールと言えるでしょう。本記事では、DWHの概要や類似システムとの違い、DWHの主な機能を解説。あわせて、DWHを導入した活用事例についても紹介します。

DWH(データウェアハウス)とは

企業内の大量データを活用するために導入されているDWH。まずは、その定義や必要性について解説します。

DWHの定義

DWHとは「Data Ware House:データウェアハウス」の略で、日本語にすると「データの倉庫」。膨大なデータを格納するシステムを指します。米国のコンサルタント・William H.Inmon(ビル・インモン)氏により「意志決定のために目的別に編成され、時系列で統合されたデータの集合体」と定義されました。

DWHは、企業の顧客情報・営業活動・マーケティングなど、別々のシステムで管理されているデータを収集し、保管できます。大量のデータから必要な情報を抽出して分析できるため、企業の意思決定を支援する役割も果たします。

DWHの必要性

DWHは、システムを横断してデータを分析する必要性から構築されました。

企業が適切な意思決定をするには、集積したデータの迅速な分析が不可欠です。しかし、これまで「会計・在庫・顧客・生産」といった業務のシステムは、それぞれ単独で構築されていました。そして、各データの保存形態の統合が難しかったため、まとめての分析は困難でした。

そこで必要とされるようになったのが、システムの横断的な分析を可能にしたDWHです。現在、DWHはビッグデータの活用が求められる企業にとって、意思決定に欠かせないツールになりつつあります。

DWHと類似システムとの違い

DWHの他にも、データを収集して保管するシステムがあります。ここでは、DWHと類似するシステムの違いを見ていきましょう。

DWHとデータベースの違い

DWHはデータ分析に特化しているシステム。一方、データベースは、主にデータの記録・参照に活用されるものです。

分析重視のDWHであれば、あらゆるシステムから収集したデータの保存形態を統合できます。これにより、データの高速処理が可能に。また、DWHはデータの消去や更新を行わずに蓄積でき、保存容量が大きいのも特徴。この点においてもデータベースと異なります。

DWHとデータマートの違い

「マート」が「小売り」を意味することからも分かるように、データマートはより小規模のデータを扱います。特定の目的で使用するデータを抽出し、格納・分析する場合に適しています。

例えば、顧客管理・営業・マーケティングといったそれぞれの部門に分け、必要な情報だけを分析する際に役立つでしょう。ただし、DWHのように、企業全体の意思決定のために膨大なデータを分析するのは困難です。

DWHとBIの違い

蓄積や整理を重視するのか、分析を重視するのかが、DWHとBIの違いと言えます。BIも格納プロセスを含んでいますが、分析プロセスにより重点を置いています。専門知識がない人でもデータ分析しやすいのが特徴。

DWHと組み合わせて使えば、包括的な分析が可能です。また、最近のBIは、DWHの機能を備えたものも多く見られます。

DWHとデータレイクの違い

DWHには構造化されたデータが格納されていますが、データレイクには非構造化データも一緒に格納されています。非構造化データとは、画像や動画、音声、電子メール、CADデータなどのことです。

データレイクでは、これらが加工されずに蓄積され、そのままの形態で活用できます。ただし、データレイクを活用するには、DWHよりも大きいストレージが必要です。

DWHの4つの機能

DWHは、データの整理や統合、保管方法における機能が優れています。そんなDWHには、主な機能が4つあります。

1. サブジェクトごとのデータ整理

DWHは、データをサブジェクト(項目)ごとに整理することが可能です。各々のサブジェクトに整理することで、散在するデータを包括的に分析できます。

例えば、「顧客」というサブジェクトの場合、氏名やID、住所、連絡先といった全システム内の顧客データをまとめられます。その結果、大規模データのシステム横断的な分析が可能になります。

2. 時系列でのデータ保管

過去から現在までのデータを時系列で保管できることも、DWHの機能のひとつ。

通常のデータベースであれば、顧客の住所や会員ポイントなどを探す場合、新しいデータが優先的に出力されます。これは、すべての情報を読み込んでいると処理に時間がかかってしまうためです。しかし、そうなると過去のデータを含めて分析するのが困難になります。

その点DWHは、過去から現在までのデータを時系列で整理・保存可能であるため、大まかなデータの流れをスムーズに把握できます。

3. 重複を避けたデータ統合

前述した通り、DWHは複数のシステムから収集されたデータの統合が可能です。

データベースの場合、同じ顧客でもIDがシステムによって文字列であったり数値であったりすると、それぞれが別の顧客として認識されることがあります。そうなると、データの分析精度が低下するでしょう。

しかし、DWHには重複の排除や表現の統一を行う機能があるため、データの整合性や分析精度が高められます。

4. 永続的なデータ保管

DWHには、格納されたデータが永続的に保管されます。膨大なデータを時系列で保管し、分析に使う目的があるためです。

ただし、容量やコストの関係上、無限にデータを保存することはできません。ある程度、不要なデータを削除したり、優先順位の低いデータをアーカイブとして残したりする必要があります。

DWHの活用事例

DWHは、既にさまざまな企業で活用されているシステムです。ここでは、活用事例を3つ紹介します。

1. CRM(顧客関係管理)への活用

顧客関係を管理するCRMのデータ管理に活用されている事例があります。それにより、顧客の購買履歴や好みの属性を把握しやすくなり、顧客の嗜好に合ったアプローチが可能に。顧客の満足度向上へとつなげています。

2. 医療データへの活用

医療機関には、電子カルテ・医事会計・看護管理・手術・調剤に関するさまざまな医療情報システムが存在しています。

それらのシステムにあるデータを集約し、統合的に扱うためにDWHを導入すると、検索や抽出が容易なり、診療の際のデータチェックがスムーズに。その他、経営や研究に関する分析にも活用されています。

3. 航空会社の空席管理への活用

多くの航空会社では、予約の空席管理にDWHが活用されています。これは、顧客の過去の利用歴を分析してキャンセルの可能性を導き出し、空席を減らすためです。空席が減れば、企業収益の向上につながります。

DWHの活用でデータ分析を効率的に

DWHにより、企業内にある複数システムのデータ集約や分析が可能です。大量のデータを蓄積し、分析しやすいように整理・保管できるため、さまざまな業種で導入され、業務の改善に活かされています。ビッグデータの分析結果が企業の意思決定に役立つことから、DWHの活用は今後さらに重要になるでしょう。

※記載の情報は、2022年12月時点の内容です。

関連記事