データウェアハウスと分析ツールの組み合わせは、元のデータから最も優れたビジネスインテリジェンスを確実に手に入れるための1つの方法です。しかし、企業はこのインサイトに結局のところどれくらいのコストをかけているのでしょうか?データ活用のための機能から健全な投資対効果を得る可能性はあるものの、どれくらい得られるかは、システムやプロセスへの初期投資に依存します。Capterra(2019年)によると、ガートナーの調査で、機能性に基づいて適切なソリューションを導入することに重点を置いた企業は、コストのみに重点を置いた企業と比較して、最高のビジネス上の利益を得ていることがわかりました。
データウェアハウスは自動でビジネスインテリジェンスを提供してくれる?
まず、データウェアハウスが実際に何をするものなのかを明確にすることが重要です。それは、多様なソースからのデータを整理された方法で保存することです。ビジネスインテリジェンス・ソリューションと組み合わせることで、企業はトレンドに対するインサイトを得て、高度な分析を行うことができます。データウェアハウスは、データがビジネスインテリジェンス・ソリューションによって照会できるようにすることを保証します。言い換えると、すべての仕事をこなすわけではありませんが、仕事を完了させるために不可欠なものです。
データウェアハウスはデータベースとは異なります。実際には、Integrate.ioのような変換ソリューションは、別々のデータベースから情報を取得し、それらをウェアハウスに格納します。あなたの変換ソリューションは、Shopify、Salesforce、Google eCommerce、そして、ビジネスのために使用している他のデータベースとシームレスに連携しなければなりません。変換は、手動で行うことも、スケジュールされ事前に設定した条件で自動的に行うこともできます。データがウェアハウスに入ると、操作や分析に適した状態になります。
通常使用されるコンポーネントの評価
データウェアハウスにはいくつかの重要な部分があります。ストレージ・プラットフォーム、トランスフォーメーション・パイプライン、そしてそれを実現する人材です。それぞれの段階で、多くのプロバイダーが競争しています。
ストレージ:インハウス or クラウド
実際にデータウェアハウスをどこに置くかを選択しなければなりません。ほとんどのエンタープライズ・テクノロジーと同様に、オンサイトのハードウェアかクラウドベースのソリューションかを選ぶことができます。クラウドベースのソリューションは、オンサイトのそれのようにスペースや先行投資、継続的なメンテナンスを必要としないため、クラウドベースのソリューションを採用する傾向が増加しています。さらに、地理的な場所に関係なくアクセスできることをサポートしているため、リモートワークにも最適です。
クラウドベースを選択した場合、一般的にはそれだけでコストを節約していることになります。クラウドソリューションでは、ハードウェア、オンサイトのITスタッフ、マシンのスペース、電気代などの運用コストが不要だからです。クラウドソリューションのコストはTBあたり月18ドルから84ドルですが、オンサイトソリューションのコストは年間12,000ドル(月1,000ドル)に及ぶとの試算もあります。
とはいえ、オンプレミスソリューションを選ぶ理由もいくつかあります。オンプレミス・ソリューションは複数の場所にあるグローバル・サーバーに保管されているため、クラウドよりもオンプレミス・ソリューションからクライアントの単一の場所へのデータの移動の方が早いことが挙げられます。つまり、オンプレミスのソリューションは、データウェアハウスが他のシステムにどのように繋がるかを完全にコントロールできるということです。
最も有名なクラウドウェアハウス・プロバイダーには、以下のようなものがあります。
- AWS (Amazon) Redshift
- Google BigQuery
- Snowflake
- Microsoft Azure
- IBM Db2
もし、ウェアハウス内のデータに頻繁にアクセスする場合は、「ホット」ストレージソリューションが必要になるので、高いパフォーマンスとスピードを提供するストレージを選択することが重要です。データへのアクセス頻度が低い場合は、スピードとパフォーマンスを少し犠牲にした「コールド」ストレージソリューションで十分かもしれません。
ビジュアライゼーション/ビジネスインテリジェンス・ソフトウェア
まず、様々なソースからデータをウェアハウスに移動させる方法について検討することが不可欠です。それから、可視化について考えることができます。
「ビジュアライズツール」と「ビジネスインテリジェンスソリューション」という用語は、よく同じ意味として使用されます。Capterraによると、ビジネスインテリジェンス・ソリューションのコストは平均で年間3,000ドル、ローエンドでは600ドル、ハイエンドでは6,000ドルとなっています。あなたのビジネスインテリジェンスのゴールは、購入するソリューションを決定する必要があります:規制遵守、収益の最適化、コスト削減などにフォーカスすることができます。
D3.jsのようなオープンソースのソリューション、またはTableauやQlikViewのようなプロバイダーを選ぶことができます。オープンソースではないオプションにはもちろん追加コストがかかります。もちろん、これはビジネスインテリジェンス・プロセスを開発する際に評価しなければなりません。
ETL Software
データの移動は通常、ETL(抽出、変換、ロード)ソリューションを介して行われます。ソリューションのコストは、選択するプラットフォームと価格モデルによって異なります。それぞれのプラットフォームは通常、様々なデータベースのスイートをサポートしています。だから、1つのオプションを選択する前に、それがウェアハウスに格納したいデータと連携できるかどうかをを確認したいと思うでしょう。例として、Integrate.ioでは、Snowflake、MySQL、Oracle、Amazon Redshift、Google BigQuery、Microsoft Azureを含む統合対象の完全なセットを提供しています。
価格面で最も注意しなければならないのは、あなたの選択する企業が採用しているコストパターンです。
多くのETLソリューションは、可変価格モデル(図B)を使用しています。これらのパッケージは、無料または低導入価格で開始しますが、あなたが実行するジョブの数に基づいて指数関数的にスケールアップします。これは、あなたの最初の月々の請求書は低く始まるかもしれませんが、あなたは時間をかけてコストが上昇するのを見ることなるであろうことを意味します。ある月に特に使用量が多い場合、多額の(予想外の)超過料金を支払うことになるかもしれません。この予測不可能な部分によって、一定の予算を維持するのが困難になります。
コストを月ごとに一定にキープするには、固定または段階的な価格設定モデル(図AまたはD)を採用したETLソリューションを選択することをお勧めします。ステップモデルは、予測可能な要因に基づいて設定された金額が増加していきますが、固定料金モデルは、1つの価格でスタートし、ワークロードに関係なく、そこから変わることはありません。例えば、Integrate.ioは、使用するコネクタ数に応じて1ヶ月間の料金を請求します。コネクタ数を追加したい場合も、その接続にいくらかかるかを正確に知ることができるので、それに応じて予算を組むことができます。月々の請求書を増やすことなく、統合を通して無制限のデータ量を送信することができ、必要な時にはスケールアップすることもできます。
IT人材
人にはお金もかかりますし、データウェアハウスのプロセスにおいて貴重な存在であることは間違いありません。満たす必要がある役割には、以下のようなものがあります。
- Information systems manager ($12,000/month)
- Backend developer ($8,800/month)
- Database architect ($9,400/month)
- Data analyst ($7,500/month)
もちろん、費やす金額は、チームの各メンバーにかかる負担によります。負担とは、あなたが彼らに依頼する仕事内容やコンポーネントソリューションの使いやすさに依存します。Integrate.ioは、マネージドサービスのオプションを備えたシンプルなドラッグアンドドロップのETLソリューションです。Integrate.ioでの作業は、潜在的にバックエンド開発者のコストを節約することができます。
コスト比較
それでは、データベースソリューションの全体的なコストはどれくらいなのでしょうか?ここでは、上記のすべてのコンポーネントを考慮に入れた平均値をいくつか紹介します。
- クラウドストレージ:1テラバイトあたり月額18ドル~82ドル
- オンサイトストレージ: $1,000/月
- ビジュアライゼーション・ソフトウェア:600ドル~6,000ドル/年
- ETLソフトウェア:月800ドル~8,000ドル以上(固定または変動のいずれか)
- IT人件費:37,700ドル/月
端的に言うと、データウェアハウスは大きな投資になる可能性があります。しかし、ビジネスインテリジェンスから得られるリターンは計り知れません。ウェアハウスを利用することで、将来のビジネス上の意思決定を正確に行うことができ、全体的なビジネスリスクを低減することができます。
ETLとしてIntegrate.ioを利用するメリット
ETLの選択に関しては、Integrate.ioで作業することで大きな利益を得ることができます。プラットフォームの直感的な機能性は、技術的なトレーニングにお金を払う必要がないことを意味します。さらに、Integrate.ioの段階的な料金体系は、透明で、手頃な価格で、予測可能です。コネクタ数に応じてコストを払うため、毎月のコストを正確に予測することができます。
とはいえ、価格は一つのメリットに過ぎません。Integrate.ioは作業に適したプラットフォームです。データベースとデータウェアハウス間の高速な接続を、リアルタイムの可用性も担保して作成することができます。このプラットフォームは、お客様自身で簡単に実行できる再現性のある透明なデータパイプラインのための選択肢を提供します。プラットフォームを使えば、データの整合性やデータ品質を犠牲にすることなく実現できます。データは信頼性が高く、アクセスが容易で、ビジネスを実施する際に使用できるインサイトに変換することができます。