ビッグデータの格納に欠かせないデータウェアハウスを効果的に活用するためのポイント

ビッグデータの格納に欠かせないデータウェアハウスを効果的に活用するためのポイント

顧客データ、オフィスデータ、Webサイトデータ、GPSやICカードなどによるセンサーデータなど、インターネットやIT技術の進化により、現在、企業はさまざまなデータを収集、活用できるようになっています。しかし、ここで問題となるのが収集したデータ、いわゆるビッグデータの格納と効果的な活用です。そこで今回は、ビッグデータを効率よく格納するための手段である「データウェアハウス」の概要と、効果的に活用するためのポイントについて考察していきます。

ビッグデータの格納を実現するデータウェアハウスとは?

データウェアハウスを直訳すると「情報の倉庫」、つまりデータを保管する場所となります。データを保管する場所といえば、データベースも同じ役割を持っています。では、「データベース」と「データウェアハウス」は何が違うのでしょうか?厳密にはさまざまな違いがありますが、最も大きな違いは保管するデータの利用目的です。

データベースは、顧客情報、商品情報などのリアルタイムで使用するデータを保管し、必要に応じてすぐに使用できるようにしておくものです。そして、取引のなくなった顧客、廃版になった商品などを削除することで、ストレージのスペースを圧迫せず、常に最新のデータを維持管理します。

これに対して、データウェアハウスは、過去のものも含めたデータを時系列で収集し、保管するものとなります。あらゆるデータを1ヶ所に集めて管理することで、さまざまなデータ分析を行い、企業活動に生かしていくことを目的としています。データ分析を行うには、できるだけ多くのデータが必要になるため、(絶対に使用しないデータを除いて)基本的にデータを削除することはありません。

また、データを削除することなく蓄積していくという点では、データレイクも同様の目的を持っています。データウェアハウスは特定の目的のために、すでに処理済みのデータを保管します。一方、データレイクは目的が未確定で未処理状態のローデータもすべて保管します。そのため、データウェアハウスのほうがストレージスペースを節約しつつ、大量のデータを保管することが可能です。

データウェアハウスを活用するメリット

続いては、実際に企業がデータウェアハウスを活用すると「どういったメリットが生じるのか」について、主なものを3つ紹介します。

1.異なるシステムのデータを統合して保管できるため、分析が容易になる

データベースでデータを保管する場合は、顧客情報は営業部、商品情報は商品管理部といったように、それぞれの部署で個別にデータを管理するのが一般的です。これにより、それぞれの部署が必要なときにデータをすぐに使えるようになり、ストレージスペースも節約されるため、高速なデータ活用が可能になります。

ただし、取引先別の商品購入履歴を作成したり、新商品のアップセルを目指したりする場合、別々のデータベースに保管されている顧客情報や商品情報を統合しなければなりません。このとき、それぞれのシステムが異なっていると統合に手間がかかります。一方、データウェアハウスであれば、異なるシステムのデータであっても統合して保管できるため、手間をかけずにすぐに分析を行うことが可能です。

2.長期間にわたる顧客動向や売上推移のデータ分析も行える

不要になったデータを削除するデータベースでは、長期間にわたる顧客動向や売上推移などのデータ分析は行えません。日常業務は最新のデータだけでも進められますが、3ヶ年計画、5ヶ年計画などの中長期計画を立案する際には、データウェアハウスが持つ「過去のデータ」が大いに役に立ちます。

3.変更された過去データの参照も可能

定番商品のスペック、価格変更の変遷、取引先の住所変更履歴など、過去から現在に至るまでに変更されたデータを参照することもデータウェアハウスなら容易に行えます。

データウェアハウスを効果的に活用するための注意点

データウェアハウスには、企業活動を行ううえでのメリットが多数あります。ただし、効果的に活用するには、いくつかの注意点もあります。具体的には次のとおりです。

1.収集したデータの活用目的を明確にする

先述したように、データウェアハウスは目的が明確なデータを保管します。そのため、活用目的を明確にしないままデータを保管していくと、それはデータウェアハウスではなく、データレイクになってしまいます。必要なときに必要な分析が行えるように、必ず活用目的を明確にしたうえで必要なデータのみを保管していかなければなりません。

2.活用目的に応じた分析方法を決める

活用目的を明確にしたうえでデータを保管したものの、それぞれの活用目的に応じた分析方法を決めておかないと企業活動に生かせるデータ分析は行えません。また、顧客の変化、販売方法の変化など、企業活動は常に変化しています。これらに対応するには、分析方法も変化に合わせ柔軟に対応できるようにしておく必要があります。データウェアハウスはさまざまなシステムのデータを統合し、一括保管することでデータ分析を容易にしてくれますが、「どういった分析を行うのが最適であるか?」を決めるのは人であることを忘れてはなりません。

3.効果的に活用できる人材教育を行う

「データ分析を行うのは人である」と先述しましたが、そのためにはデータを効果的に活用するための人材教育を徹底しておくことも重要です。データウェアハウスを無用の長物にしないために、属人性を高めないようにすることも欠かせません。専任のスタッフ1人が高い技能を持っていても、その人材がいなくなってしまえば、効果的なデータ分析は行えなくなります。そうしたリスクを避けるために、定期的に人材教育を行い、異動や退職があっても、すぐに同等レベルのデータ分析が行える人材を育成しておく必要があります。これにより属人性が排除され、常に一定レベルのデータ分析ができるようになります。その結果、長期的かつ効果的にデータウェアハウスを活用していくことが可能となります。

まとめ:「データ収集ありき」ではデータウェアハウスを効果的に活用できない

データウェアハウスは、多種多様なデータを統合して一括管理することを可能にします。また、基本的にデータを削除せずに蓄積していくため、長期間にわたって詳細な分析が行えるなど、さまざまなメリットを有しています。しかし、活用方法を決めずに「とりあえずデータを収集するだけ」では、管理コストがかかるばかりか効果的な活用も実現できないでしょう。

データウェアハウスを効果的に活用する最大のポイントは、利用目的を明確にし、そのために「どういったデータを収集すべきか?」を決めることです。また、大量のデータを扱うことになるため、効率やコスト面から「クラウド」ではなく「オンプレミス」で構築することも検討する必要があります。

そこでおすすめしたいのがINFINIDAT InfiniBoxです。非常に効率的なシンプロビジョニング、継続的なスペース再利用、インラインデータコンプレッションにより、システムキャパシティを最大限に活用できるのが特長です。大量のデータを収集し、数PB超の有効キャパシティが必要な場合も、INFINIDAT社のシステム(シングル42Uラック)を使うことで、簡単に、そしてコストパフォーマンスの高い方法で複数のシステムを統合できます。データウェアハウスの活用する際は、ぜひINFINIDAT InfiniBoxの導入も検討されてみてはいかがでしょうか。