統合データ分析基盤がコストダウンとパフォーマンス向上を実現

統合データ分析基盤がコストダウンとパフォーマンス向上を実現

増える一方のデータ、その管理コストや漏えいリスクへの対処など、課題は山積されています。その一方で、データを分析することにより次のビジネスの力にもできる、という2つの側面を持っています。データを価値あるものにするには、現在のデータの持ち方について、基盤から見直すことが第一歩となります。統合データ分析基盤を持つことが、有用なデータの発掘機会を増やし、間接的なコストダウンを実現するということを紹介します。

データが将来に及ぼすビジネスへの影響

あらためてデータというものと、その活用の可能性について再確認してみましょう。

データを活用することの意義

ビッグデータテクノロジーに代表される、データの分析からビジネスや経営に役立つ情報を見つけ出すことや、IoT(モノのインターネット)技術により、あらゆる機器や設備から稼働状況をはじめとしたデータが得られるようになりました。そして、それらのデータ解析から判定や機械の制御などをコンピューターが行うAI(人工知能)が、データ利用拡大のけん引役になっています。データを経営やビジネスに活かすことが企業経営の重要な鍵になり、その優劣が企業の将来を決めかねない状況になりつつあるのです。

もろ刃の剣のデータ

有用であるデータですが、価値があるゆえに今後も増える一方となり、その管理コストが企業にとって負担となることが目に見えています。企業内の複数の部署が一斉にデータを蓄積するようになると、これまでのように各部署が縦割りで管理することのコスト的な大きな無駄が浮き彫りになるのです。また、データを分散して保管することで、データ利用の機会を失うことにもつながるのです。これは「データのサイロ化」と呼ばれています。

縦割りの組織が基本の日本企業の弊害として、情報やデータが部署の間で共有されていないこととも関係しています。会議や報告書の交換により、ある程度は情報共有が進むかもしれませんが、機密性の高いデータとなると、なおのこと共有が進まないという課題があります。その企業文化についても見直しながら、データについて考え直していく必要もあります。

統合データ分析基盤を作る必要性

そこで求められるのが「統合データ分析基盤」です。ひと言でいえば、企業内のデータを一元管理するためのプラットフォームとなるものです。

統合データ分析基盤とは?その目的は?

「統合データ分析基盤」は、これまで説明したことの対局にあるデータの保有・運用形態です。この基盤を持つことで、データの一元管理による「情報の共有」や「データの有意義な活用」が推進でき、さらにデータ管理コストの圧縮にもつなげられるのです。そして統合化により各部署のデータが可視化されるようになれば、その存在価値を吟味でき、加工や組み合わせることで新たな価値を生み出せるようにもなります。

次のステップとしては、今後のデータの残し方にまで意識が及ぶようになり、データ運用の好循環が生まれることになります。その意味では、統合基盤をしっかりさせないと、データの運用も思うようには進まないということです。

具体的な統合データ分析基盤

名称としては、「データパイプライン基盤」、「データ統合/マネジメントプラットフォーム」、「データ活用基盤」、「データ分析活用基盤」、「データ活用基盤」なども一般的に使われています。しかし、どれもデータの統合基盤を意味することには変わりありません。呼称は違ったとしても、各部署に散在するように保管されているデータを対象に、積極的な活用を前提として統合・一元管理することを前提としたデータインフラを構築することがその目的です。多少の違いはあっても「統合データ分析基盤」としての役割、目指すところ、また主要な機材となるストレージの性能要件などは同じものが求められることになります。

統合データ分析基盤の構築に当たり

続いて、その「統合データ分析基盤」の理想的な姿について考えてみましょう。ひとつは、最初から用途などを限定し、その範囲内で目的にかなうデータだけを集めるという運用ではない、ということです。可能な限り多くの種類のデータを集め、そのなかから「価値ある分析結果を導くデータの組み合わせ」を選択できるようにすることが重要なのです。

仮に、用途や目的を明確にして少ないコストと期間でデータを集められたとしても、限られた範囲でのデータ活用では、それが最も効果的なデータかどうか分からないこともあります。そのあとに追加で別のデータを探しているようでは、効果的なデータ活用にはなかなかたどり着けません。そうなるとコストもかさむため、最初から広く網をかけてデータを収集、蓄積した方が効率的で、求める結果も早期に得られる可能性が高くなると言えるでしょう。なるべく多くのデータの組み合わせを試せる環境が重要なのです。

そして、もちろんデータの量だけではなく、分析結果を早く出せるような基盤でなくてはなりません。統合データ分析基盤は、フラットでありシームレスに使えるように、数多くの種類の膨大なデータを整えられる環境であるのが理想的なのです。その環境に不都合があると、データの検索や引き出し、分析工程への転送などに時間やコストを要するといった支障をきたし、データそのものの利用から遠のいてしまうという弊害を生むことになりかねません。

まとめ:早めの対応が将来の余裕を生む

結論としては、多種多様かつ膨大なデータを収集・蓄積でき、高速に分析処理することが可能なプラットフォームとなるストレージシステムが、統合データ分析基盤構築のキーとなるということです。

そこでおすすめしたいのがINFINIDAT InfiniBoxです。非常に効率的なシンプロビジョニング、 継続的なスペース再利用、インラインデータコンプレッションにより、システムキャパシティを最大限活用できることは、統合データ分析基盤を構築、運用するうえでの優位性となります。特にペタバイトを超える有効キャパシティが必要なケースでは、シングル42Uラックでマルチペタバイト規模の大容量を、低総所有コスト(TCO)で実現でき、簡単に、そしてコストパフォーマンスの高い方法で複数のシステムを統合できます。

例えば、次のようなデータの処理には最適です。

  • 基幹業務システムで扱っているデータ、例えば、顧客情報や購買履歴、在庫情報などの構造化データ
  • IoTセンサーで取り込むデータや画像、動画等異なる形式の非構造化データ
  • ソーシャルメディア、交通管理/制御情報、地理、気象情報のデータ

データと分析の必要性は理解していても、その準備があと回しになっていることもあると思います。しかし、ライバル企業が先んじていると、キャッチアップは容易ではありません。データの扱い方、分析の方法とデータの活かし方には経験が必要であり、将来的には扱うべきデータがいっそう増えていくからです。そのためにも、INFINIDAT InfiniBoxのようなポテンシャルを持ったストレージの導入だけを先に進め、データ分析の経験を積みつつ、扱うデータの範囲を広げ、それに合わせてシステムの統合の範囲を拡大していく方法などがあります。いずれにせよ、早めの対応が重要であるということです。