ギガバイト単価に見るストレージの使われ方とその背景

企業がストレージサービスを選択するとき、ギガバイト単価はとても重要な要素といえます。企業が必要とするストレージ容量は増大しており、「少しでもコストを抑えたい」という要望があるからです。なぜ、それほど大きなストレージが必要とされているのでしょうか? 大容量ストレージの価格について、企業が大容量データを扱う背景とともに説明します。

ギガバイト単価とは

ギガバイト単価は、ストレージ(サーバー、メモリ、ディスクなど)の価格を容量で割った数値で、「そのストレージが1GBあたりいくらか?」を示します。ストレージサービスの価格やコストパフォーマンスを比較するために使われ、GB単価と記す場合もあります。

以前は、「1MBあたりいくらか?」というメガバイト単価がよく利用されていました。しかし、近年は必要とされるストレージ容量が増加しているため、ギガバイト単価がよく用いられています。ギガバイト単価は、企業が契約するストレージサービスをはじめ、個人のPCやモバイル端末用のメモリまで、さまざまなところで使われています。

1. ファイルサーバーの価格

ファイルサーバーによく使われるのは、HDD(NAS)とクラウドサービスです。

  • HDD(NAS):数十円~百数十円/GB
  • クラウド:無料~数十円/GB

クラウドサービスのほうが単価は安いですが、企業が利用するときは、可用性やセキュリティ、サービスの安定性などの要素も考慮しなければなりません。最近は、企業がファイルサーバーとして利用するストレージの容量がさらに増加しているため、「1TBあたりいくらか?」というテラバイト単価が用いられる場合もあります。

2. アーカイブサービスの価格

長期保存用のアーカイブサービスでは、磁気テープや光ディスクなど、長期保存に向いているメディアが使われるケースが多いといえます。

  • 磁気テープ:約3円/GB
  • 長期保存用光ディスク:約20~30円/GB
  • クラウド:約1円~/GB

クラウドサービスを利用する場合は、冗長化といった対策が必要になります。また、サービスの安定性にも注意する必要があります。

非構造化データの増加に伴い大容量ストレージが必要に

企業がビッグデータを活用する機会が増えていることが挙げられます

データは、「構造化データ」と「非構造化データ」に分類できます。構造化データとは、行と列で表現可能なRDBに格納できるデータのことです。データベース化されている「アプリケーションで管理されるデータ」ともいえるでしょう。ERP、CRM、SCMといった業務ソフトウェアのデータも、内部では構造化されているため構造化データの1種です。構造化データは分析や集計が行いやすく、企業でもさまざまな分野で活用されています。

一方、非構造化データとは、アプリケーションでは管理できない、ファイルシステムにそのままの形で格納されるデータを指します。契約書や注文書、CAD図面、プレゼン資料、画像、動画、音声などさまざまな種類があり、ファイルごとに用途や形式が異なるため、データベース化されていないのが一般的です。

構造化データと非構造化データを合わせたものがビッグデータと呼ばれます。ただし、業務で扱われているデータの多くは非構造化データのため、「ビッグデータの大部分は非構造化データである」ともいえます。

現在、多くの企業で業務がIT化、システム化されており、非構造化データが毎日のように増え続けています。こうした非構造化データを保存するための、大容量ストレージが必要になるというわけです。非構造化データは今後も増え続けることが予想されます。ITの活用がますます活発になり、マーケティングや商品開発などにビッグデータを活用する場面も増えていくと考えられているのです。

非構造化データの運用管理は難しい

非構造化データは量が多いだけでなく、運用管理がとても難しいデータといえます。理由としては、次のような要因が挙げられます。

1. データの増加によるコストの増加

増え続けるデータを保管するには、大容量のストレージが必要です。加えて、大容量ストレージを維持するためのハードウェアやソフトウェア、機器を管理するコストや人手も必要になります。そのほか、データの消失や破損に備えて、冗長化やバックアップも行わなければなりません。増え続けるデータを適切に分類、保存、運用していくために、社員を教育するコストも必要になります。

2. 既存の業務システムとの連携が大変

新しく作成されるファイルは、種類や用途に応じて既存の業務システムと連携させながら、分類して保存する必要があります。そのために、既存のワークフローを修正しなければならない場合もあります。部署ごとに異なるルールでデータを管理している場合は、連携作業がより困難です。業務システムによっては、他部署との共有すら不可能な場合もあります。増え続けるデータを業務システムと適切に連携させたり、利用しやすく分類したりするのには、多くの手間がかかるのです。

3. データを検索しにくい

非構造化データにはさまざまなファイル形式があるため、一括検索しにくいことも管理を難しくする要因です。部署によってファイルの保存ルールが異なる場合も多く、ファイル名だけでは目的のファイルを探し出せないケースもあります。データ量が増えれば増えるほど検索が困難になり、ファイルの検索に多くの時間が費やされてしまうようでは、データを効率よく活用できません。

4. バージョン管理が大変

データの検索が難しくなると、更新作業にも影響がおよぼされます。同じ文書の前バージョンがあることに気づかず、新たにファイルを作成してしまう可能性があるのです。バージョン管理がきちんと行われなければ、同じ文書が複数存在することになり、「どのファイルが最新なのか」が判別不可能となるケースもあります。「誰が、どのファイルを、どう操作したのか」というログを保存し、履歴を残しておけばすむ問題ですが、これはさらにデータを増やすことにつながります。

ギガバイト単価以外のストレージ選定ポイント

企業がストレージを選ぶときは、ギガバイト単価のほかにも、以下のポイントに注意しなければなりません。

1. 必要な容量

ストレージの価格は「使用する容量」で決まることが多いため、「どれくらいの容量が必要か?」をできるだけ正確に見積もる必要があります。見積もりをもとに、最適なストレージを選択します。ただし、非構造化データは毎日のように増え続けていくことに留意しなければなりません。多くのベンダーでは、少容量からスタートして、段階的に使用量を増やしていくことが可能なので、「どのくらいの拡張性があるか?」もしっかりと確認しておく必要があります。

2. パフォーマンス

ストレージの「アクセス速度」も重要なポイントです。大容量のストレージでは、1回のファイル検索にもある程度の時間がかかることが予想されます。ストレージへのアクセス速度だけでなく、ストレージへの接続方法や回線速度なども確認しておく必要があります。

3. 高い信頼性と可用性

ストレージを比較するときにもっとも重要なことは、データを消失・破壊させずに保存・管理できることです。そのためには、ストレージの信頼性や可用性がポイントになります。故障せず長時間稼働できる、冗長化されていてトラブルがあってもすぐに起動できる、自動バックアップ機能が用意されている、などのポイントも確認しなければなりません。

4. セキュリティ

企業が扱うデータには、機密性の高い資料や個人情報が多く含まれています。そのため、2段階認証や暗号化など、情報漏えいや不正な操作に対する対策が施されている必要があります。各ストレージのセキュリティ機能についても十分に検証しておかなければなりません。

5. 運用管理しやすい

非構造化データが増えるにつれて、ファイルの管理は難しくなります。デモ版や試用版でファイルシステムのインターフェースや操作体系などを確認し、わかりやすく、使いやすいストレージを選択するとよいでしょう。

大容量ストレージならINFINIDAT InfiniBoxがおすすめ

大容量ストレージを業務で利用する場合は、INFINIDAT社が提供するストレージ「InfiniBox」がおすすめです。クラウドサービスのように、使った分だけ料金を支払う仕組みになっているため、低コスト&高パフォーマンスを実現できます。出荷前に厳しい耐久テストを行っているため、信頼性にも定評があります。

まとめ:非構造化データをビジネスに生かすなら大容量データの管理に最適なストレージが必要

非構造化データの増加により、今後も企業が扱うデータの量は増え続けていくと思われます。これらのデータを適切に管理し、必要なデータをすべて保管しておくには、大容量データの管理に向いたストレージが不可欠となります。INFINIDAT InfiniBoxのように、低コストでありながら高いパフォーマンスを誇り、信頼性の高いストレージを選択することをおすすめします。