Fivetran と Stitch Data は、ETL ツールの大論争における2大勢力ですが、両プラットフォームにはそれぞれ利点と問題点があります。そして自身のビジネスに適した ETL プラットフォームの選択は、分析する必要があるデータの種類や、そこから得られると期待される BI(ビジネスインテリジェンス)など、その会社特有の要因によって変わってきます。

この ETL/ELT プラットフォームのうち、データスタックに追加するのに適しているのはどれでしょうか?

Fivetran と Stitch Data には、主に以下の5点に違いがあります:

  • Fivetran は クラウドベースの自動化プラットフォームで、複数のクラウドプラットフォームへのデータの出し入れがしやすい。
  • Stitch は、フルマネージドサービスを通じて、企業がクラウドベースのデータウェアハウス内でデータセットを複製するのを支援する。
  • Fivetran には、毎月50万に満たない接続しか必要でない組織に対する無料アクセスがある。
  • Stitch は、カスタマーサポートへのアクセスや信頼性においてあまりいい評価をもらっていない。
  • Fivetran がほぼリアルタイム更新であるのに対し、Stitch にはバッチベースの更新しかない。

本記事では、Fivetran と Stitch Data を一般的な使用目的、考慮すべき利点や機能、そして自身のユースケースに最適な ETL または ELT プラットフォームの機能を選択する方法について見ていきます。

はじめに

ETL(抽出、変換、格納)および ELT(抽出、格納、変換)ツールは、大規模なデータセットがある企業には大きなメリットがあります。データ管理、分析、統合、品質が強化され、自動化されたプロセスによって効率が上がり、さらに、このようなデータ統合ツールは拡張しやすく、過去のデータを追跡することができ、データセキュリティの向上を通じて組織やデータチームが規制コンプライアンスを維持できるようになります。

Fivetran と Stitch Data の論争において:

  • Fivetran はクラウドベースの自動化プラットフォームで、複数のクラウドプラットフォームにデータを簡単に出し入れできる。
  • Stitch で、企業はフルマネージドサービスを通じて、ラウドベースのデータウェアハウス内でデータセットを複製することができるようになる。

Fivetran と Stitch のような ELT/ETL ソリューションプロバイダーのどちらを選ぶかは、互いに似たようなものなので難しいかもしれません。組織は、優先順位の特定や、組織目標の客観的な見直しが必要であり、どの ETL ツールが最適かは、様々なタイプのデータセット、典型的なビジネスのシナリオ、および組織にとって最も重要なメトリクスに基づいて、比較プロセスの結果で決まります。

thumbnail image

Fivetran の概要


thumbnail image



 
Fivetran のダッシュボード (画像提供t: https://fivetran.com/static-assets-docs/_next/static/media/ald-landing-page.dd0f3851.png )

G2 の評価:5つ星中4.2

クラウドベースのデータ統合プラットフォームである Fivetran は、中央データウェアハウスに格納するためにソースからデータを取得するあらゆるビジネスにおいて、優れたパフォーマンスを発揮します。

Fivetran は、あるソースからデータを抽出して、それを別のソースに格納するだけの組織だと、広範なコーディングスキルは求められませんが、データの変換が必要なユーザーには、SQL の基本的な知識が必要です。なのでコーディングのスペシャリストやデータエンジニアを雇用していない組織の場合、SQL Fivetran の構築済みオプションを選択するといいでしょう。

Fivetran には、毎月の接続数が50万以下であればアクセスが無料になりますが、大規模な組織にとって、これはほとんどの場合で現実的なオプションではないことから、新規ユーザーは、プラットフォームのサブスクリプションプランのいずれかを無料トライアルで試すことができます。料金については公表されていませんが、Fivetran のレビューによると、価格設定は消費量に基づく(使用量が増加するにつれてスケールダウンする)ことがわかっています。つまり、広範なデータがある月だと、データ統合のためにしっかりとした予算配分が求められる組織にとって、Fivetran は難しい選択肢になります。

 Fivetran と Stitch Data を比べると、 Fivetran は以下のような場合に良い選択肢となります:

  • データ変換はすでにカバーされている。
  • データをウェアハウスに格納するだけ(Fivetran はデータレイクには対応しない)。
  • 分析のための複雑なパイプラインがない。

Fivetran の有利な点: このプラットフォームには、すぐに使える何百ものデータ統合コネクタがある。

thumbnail image

Stitch Data の概要


thumbnail image



Stitch Data のダッシュボード(画像参照:https://images.ctfassets.net/k49d63tr8kcn/6emkogZCCX6pVXGApDIGMR/b37d088b4026f37547664c4a1eb42faa/hubspot-replication-summary.png

G2 の評価:5つ星中4.5

Stitch Data by Talendは、100以上のデータコネクタを備えた ELT ソリューションであり、あらゆる規模の企業やさまざまなデータタイプに対応しています。また、このデータ統合ソリューションは、SOC 2 などの多くのデータガバナンスフレームワークに加え、GDPR と HIPAA(それぞれヨーロッパとアメリカのデータプライバシーとセキュリティ規制)に対応しています。

Fivetran と Stitch のデータツールキット論争において、Fivetran はユーザーにREST API へのアクセスを提供しているのに対し、Stitch はこの機能を提供しておらず、その代わりに、Stitch Connect を使って他のデータ統合ツールと統合します。ただし、価格に関しては Stitch が優勢です: Stitch 契約者は、月あたり 500 万行のアクティブ行に対応し、必要に応じてスケールアップすることもできる、月額100ドルの Standard プランで問題ないようです。

また、Advance プランは月額1250ドルで、Premium プランは月額2500ドルです。ちなみに、Standard プランの加入者は月払いか年払いのオプションがありますが、Advance プランとPremium プランの加入者は年払いのオプションしかありません。

ただ、Srandard サブスクリプションの唯一の問題点は、契約者が Advanced およびPremium の契約者と同レベルのカスタマーサポートを受けられないことです。

Fivetran とは逆に、Stitch は ELT ツールであり、ユーザーが最初にデータを抽出してそれを格納して、次に Stitch がデータウェアハウスまたはレイク内でそのデータを変換します。対する Fivetran  は ETL ソリューションであるため、ユーザーは(基本的なコーディングスキルがあるにせよ)データを抽出してそれを変換してから、好みのデータウェアハウスに格納することができます。

Fivetran と Stitch Data と Integrate.io の比較概要

Fivetran

Stitch

Integrate.io

主な機能:

データの:

  • 抽出

  • クリーニング

  • 変換

  • 同期

  • クラウドネイティブ

  • 完全管理

  • パイプラインの自動継続更新

  • 選択的レプリケーション

  • 簡単なデータ変換

  • 簡単なワークフロー作成

  • REST API

  • データセキュリティおよびコンプライアンス

事前構築済みコネクタ:

  • 450以上

  • 140以上

  • 150以上

カスタマーサポート:

  • 総合サポートポータル

  • ライブステータスページ

  • 機能リクエストポータル

  • Standard: ライブチャットサポートとオンラインポータル

  • Advanced: ゴールドレベルのサポート

  • Premium: プラチナレベルのサポート

  • ライブチャットサポート

  • 電話サポート

  • ドキュメンテーション

  • ウェビナー

プランおよび料金:

  • 無料: 永年無料プラン(50万回線以下に限定)

  • スターター:非公表

  • スタンダード 非公開

  • エンタープライズ 非公開

  • *Standard:月額100ドル、月払いまたは年払い

  • *Advanced:年払いで一月あたり1200ドル

  • *Premium:年払いで一月あたり2500


*すべてのプランで、クレジットカード不要の14日間の無料トライアル有り。

  • Starter:年額15000ドル、追加1コネクタにつき2000ドル

  • Professional:年額25000ドル、追加コネクタ1個につき2000ドル

  • Enterprise: コネクタ追加料金は非公表。

 主な機能

Fivetran

  • データウェアハウスとストレージオプション
    • クラウドデータウェアハウス
    • データベース
    • オンラインのデータプラットフォーム
    • データレイク
  • 使いやすさおよび UI(ユーザーインターフェース)
    • シームレスに自動化されたデータフロー
    • コネクタの設定が簡単
    • カスタムコネクタの作成はユーザーの責任であり、使い勝手がいいわけではない
  • カスタマイズと柔軟性
    • カスタムコネクタを使う場合、カスタマイズは無制限
    • Fivetran には、すぐに使えるコネクタでも、カスタムコネクタでも、フルシンクしかない。
    • 選択同期はできない。
  • オートメーションおよびスケジューリング
    • 完全自動化
      データソースが正規化されたスキーマになる

Stitch Data

  • データ統合機能
    • データベース
    • SaaS アプリケーション
  • データウェアハウスとストレージオプション
    • クラウドベース
  • 使いやすさおよび UI
    • ETL プロセスはシンプル
      変換プロセスは少し精彩を欠くと言われている
  • カスタマイズと柔軟性
    • 使いやすく直感的な UI
      基本的なデータ統合の知識がないと、もっと詳しい学習が必要だと言うユーザーもいる
  • オートメーションおよびスケジューリング
    • コネクタごとにデータ転送をスケジュール
      コネクタごとにレプリケーションの頻度をカスタマイズ可能

Integrate.io

  • データ統合機能
    • Salesforce から Salesforce への接続など、200を超える様々なソースからのデータ接続
    • データソースには、パブリックおよびプライベートのクラウドサーバーとオンプレミスのインフラが含まれる。
    • データは完全に変換され、データウェアハウスやデータレイクに送られる前にクレンジングされる。
    • データモデリングとデータアーキテクチャのニーズがシンプル化される
  • 使いやすさおよび UI
    • 自動化された、コード不要のインターフェース
    • 簡単なセットアップ、ユーザーに優しいダッシュボード
  • カスタマイズと柔軟性
    • ドラッグ&ドロップのインターフェースで
      • API のパラメータをカスタマイズ
      • データフィールドの確定の作成
      • データヘッダーの名付け
      • 何百もの構築済みコネクタとの統合や独自の API の作成
  • オートメーションおよびスケジューリング
    • 独自のキーの設定で、データパイプラインの統合やマージが可能になる
    • 各エンドポイントの接続頻度の設定
    • コネクタと必要な頻度に応じた、抽出、変換、格納のスケジュールの設定

パフォーマンス分析

データ処理の速度

  • Fivetran: ほぼリアルタイム
  • Stitch:段階的なバッチ処理。 リアルタイムではない。
  • Integrate.io: バッチ処理およびリアルタイム処理
  • パフォーマンス部門では Stitch が最も遅く、Fivetran がほぼリアルタイム処理で一歩リードしているが、バッチ処理かリアルタイム処理かの選択では Integrate.io がトップである。

信頼性とアップタイム

スケーラビリティ

 料金およびプラン

価格体系の比較

  • Fivetran: 4つのプランがあり、最下層は無料、その他のプランの価格は公表されていない。
  • Stitch: 月額100、1200ドル、2500ドルの3プラン。
  • Integrate.io: 年間15000ドル、25000ドル、エンタープライズプランの3種類。

各種プランとその内容

  • Fivetran のプラン: 消費量によって異なり、月の接続が50万またはそれ以下しか必要ない組織への無料アクセスがある。
  • Stitch のプラン: Standard の加入者は月額または年額ベースで100ドル。他のプランでは年ごとの支払いが必要。
  • Integrate.io のプラン: すべてのプランで、一定数のコネクタが提供され、追加のコネクタは、StarterプランとProfessionalプランで 2000ドル。ちなみに Enterprise アカウントの追加コネクタ料金は非公開。

さまざまな事業規模に対応する費用対効果

  • Fivetran:データエンジニアリングチームがなく、大規模な ETL サービスが必要な組織に適している。
  • Stitch:シンプルなプロジェクトや、自分たちでコーディングできるチームがある企業には良い選択肢となる。
  • Integrate.io:コーディングの経験がほとんどなく、すべてのデータ統合要件に対してすぐに使えるソリューションが必要な組織に最適。

長所と短所

Fivetran

  • 長所:
    • ほぼリアルタイムのデータ複製
    • 基本的な標準化
    • 多様なインジェストプラグインの可用性
  • 短所:
    • RDBMS からのビューベースの取り込み
    • 詳細なロギング
    • API サポート

Stitch

  • 長所:
    • データインジェストの自動化
    • 多くのソースと統合しやすい
    • Fivetran ほど高価ではない
  • 短所:
    • 使い勝手が悪い
    • 何が問題なのかを判断できるようにエラーメッセージの改善が必要

Integrate.io

  • 長所
    • カスタマーサービス
    • シンプルなユーザー体験
    • 何百もの組み込み済みコネクタ
    • API で独自のコネクタを構築可能
  • 短所:
    • エラーログは、問題がどこで発生したかを確認するのに十分なほど詳細でないことが多い。

ユースケースと産業用途

Fivetran、Stitch Data、Integrate.io は、今日の大企業に信頼されているデータ統合ソリューションです。

Fivetran

Fivetran で、企業はエンジニアリング時間を節約し、インジェストとレポーティングの時間を削減することができます。

  • Fivetran の典型的なユースケース:
    • 複数のデータベースから業務データを分析
    • Web サイトデータとトランザクションデータの結合
    • 中央データハブ

Stitch Data

Stitch Data で、企業はより優れた BI(ビジネス インテリジェンス)情報を取得し、より迅速な市場投入が実現します。

  • Stitch Data の一般的な用途
    • 分析構造
    • BI におけるインサイトの向上
    • 市場投入までの時間短縮

Integrate.io

Integrate.io の ETL、リバース ETL、および強固なレポート機能は大手企業から信頼されてます。例えば、CommonLit では年間 22 日分のエンジニアリングリソースが節約され、RaiseMe は Integrate.io と提携して以来、エンジニアリングリソースを消費していません。

  • Integrate.io の典型的なユースケースと一般的なアプリケーション:
    • 自動注文処理
    • 在庫管理
    • 顧客データの同期
    • データ量の多い組織からの BI の獲得
  • 業界固有の適合性
    • Fivetran: テクノロジー、機械学習、分析
    • Stitch Data: 小売
    • Integrate.io: 詳細な BI 分析に依存しているあらゆる業界があるが、典型的なのは小売業とeコマース

カスタマーサポートおよびコミュニティ

カスタマーサポートサービス

  • Fivetran には、一般的なサポートポータル、リアルタイムのステータスページ、機能リクエスト用のポータルがある。
  • Stitch のカスタマーサポートは、利用するプランのランクによって異なる。Standard ユーザーではライブチャットとサポートポータルを利用できるが、AdvancedとPremiumのユーザーはそれぞれゴールドとプラチナサポートを利用できる。Stitchは、ゴールドまたはプラチナレベルのサポートに何が含まれるか、またはこのサポートが他のサブスクリプションレベル間でどのように変わるのかを公表していない。
  • Integrate.io は、ライブチャットや電話によるユーザーサポート、ユーザーマニュアル、ウェビナー、その他の学習教材がある。

カスタマーレビューおよびフィードバック

  • Fivetran: Twenty-three of 365 のユーザーレビューのうち23件がカスタマーサポートについて言及しているが、このレビューの大多数が Fivetran のカスタマーサポートは素晴らしいと述べている。
  • Stitch::カスタマーサポートに言及した3件のユーザーレビューのうち、Stitchには優れたカスタマーサービスがあると述べたのは1件のみ。他の2人のレビュアーは、カスタマーサポートは非活動的か遅いとしており、1人のレビュアーは、サポートは3日に1回しか応答しないと述べている。
  • Integrate.ioIntegrate.io の 189 件のユーザーレビューのうち 31 件が、カスタマーサポートについて言及しており、そのレビューは、カスタマーサポートとテクニカルサポートはいつでも対応可能であり、迅速であると述べられている。

どれが最適か

どのデータ統合ソリューションが最適であるかは、予算、ユースケース、その他の要件によって異なります。
Fivetran の料金は使用量に基づいているため、大量のデータ フローを使用する予算重視の組織には適していない可能性がありますが、 最小限のデータがある場合は、これで機能する可能性があります。 ただし、一部の組織では、データ消費量が月ごとに変動し、それでより大きなボリュームにスケールアップすると、非現実的な料金が発生する可能性があります。

Stitchは、Premium プランでない限り、最低限のカスタマーサポートしかありません。Fivetran のように、料金はデータ抽出と負荷の重さの直接の結果であり、高いデータ転送量に踏み込むと、Stitch には手が出ないと感じる企業もあります。
一方、Integrate.io は、コネクタを月額定額制で提供しており、必要なデータ量や処理能力に基づいて料金が計算されることはありません。なので、企業はこの定額料金モデルで、予測可能な予算を維持することができます。

探し求めている ETLソリューションは Integrate.io かもしれない

Integrate.io でデータのサイロ化をどのように解消できるかを自身の目でご覧になりませんか? こちらから ETLの 専門家とのデモをスケジュール頂ければ、ETL の専門家が 14日間の無料トライアルへのサインアップをお手伝いします。

そしてご登録後は、最初のデータパイプラインの構築を開始できます!ETL トライアルのセットアップに関する面談をご予約いただくと、専属のデータ担当者が、無料のライブデモを最大限に活用する方法をご説明いたします。

独学で学びたい方は、こちらからお気軽にご参加ください!トライアル中やサインアップ中にもし行き詰まったら、メールでお問い合わせいただくか、入門ドキュメントをご覧ください。


.