1979年、Teradataはカリフォルニア工科大学とシティバンクの共同研究からスタートしました。今日、このエンタープライズ・ソフトウェア企業は、ビジネス・インテリジェンス・ツールとデータマネジメントを再定義することに専念しています。現在では「Teradata Database」は「Vantage」となり、この名称は、会社の進化を強調するだけでなく、技術系ユーザーがツールに対してより多くのことを求めるようになったことを意味しています。
企業においてデータ統合は不可欠であり、そのソースはオンプレミスのデータベースからSaaSアプリケーションまで多岐にわたります。効果的なETL(抽出、変換、読み込み)ツールを使ってデータを照合・整理することは、利益を増大させるインサイトを得るための最初のステップです。そして次のステップは、現在利用可能な最も強力なデータアナリティクスツールを見つけることです。
Teradataとは?
Teradataは、アナリティクスに特化したデータマネジメントソリューションです。Teradataが提供するデータベースやデータウェアハウスは、同社自身が「業界をリードする」と称しており、レビュアーもそれに同意する傾向にあります。
Teradataは特許取得済みのアーキテクチャMPP(Massively Parallel Processingの略)を採用しており、MPPは、より複雑なアナリティクスの課題を分解し、並列トランスポーターによって分散させることで、効率的なワークロード管理を可能にします。Advanced SQL Engineは、このアーキテクチャを活用し、完全なスケーラビリティを提供します。Teradata Ecosystem Managerでは、ユーザーがドラッグ・アンド・ドロップのインターフェイスを使ってワークフローを作成することができます。
Teradataは、使いやすさや価格の面で、SnowflakeやGoogle Big Queryなどの他のデータウェアハウスやアナリティクスプロバイダーと同様の評価を受けています。
次のセクションでは、Teradataを最適化してデータを最大限に活用する方法について説明します。
1. Analytics4Dアナリティクスによるデータ品質の向上
企業はタイムリーで正確なデータ分析を求めています。Teradataは、時系列とテンポラルデータ、地理空間データを統合し、あらゆる質問に対して「いつ、どこで」という質問に回答する4Dアナリティクスを生み出しました。IoTエッジコンピュータソリューションに基づいて、4Dアナリティクスのゴールは、企業がビジネスを最適化するために生データをすぐに使用できる実用的な分析に変換することです。生データが分析目的にフィットしているかどうかを確認するにはどうすればよいでしょう?その答えはIntegrate.ioのようなETLツールを利用して、すべてのビジネスデータを1つの場所に集め、Teradataのアナリティクスが機能するように正しい構造にすることです。
2. ビジネスの優先順位を設定してデータ品質を向上
Teradataの人気のある利点の1つは、ビジネスデータを受信した逐次処理するだけではありません。管理者やデータ・チームは、SLAやシステム・リソースを管理するために、優先順位を設定したり、ワークロードを調整したりすることができます。
管理者は、Teradata Database Priority Schedulerにアクセスできます。この機能により、管理者はリソースの割り当てを制御し、過度にリソースを消費するクエリが重要なワークロードからリソースを奪うのを防ぐことができます。
独自の優先順位に基づいて、またはツールにCPU使用率を監視させることで、優先順位の変更を自動化することができます。
3. 統合されたアプローチによるデータ品質の向上
Teradataのもう一つのイノベーションは、クラウドベースのデータ分析プラットフォーム「Vantage」です。これは、データレイクやデータウェアハウス、その他のソースをまとめて、潜在的に無限のビジネスインテリジェンスを実現するためのものです。詳細な分析により、消費者や顧客の行動、トランザクションの変化、アプリの使用状況、通常値または指定されたパラメータからの逸脱などをフラグすることができます。これにより、リッチでスピーディなインサイトを得ることができます。
Vantageの目標は、企業内のあらゆるチームのメンバーが、必要なインサイトに簡単にアクセスできるようにすることです。そのため、Vantageは、Integrate.ioと同様に、簡単に使用できるローコードまたはノーコードのインターフェイスで動作します。Integrate.ioはデータを均質化し、Vantageはデータが何を意味するのかを教えてくれます。
4. BTEQとSQLコマンドによるデータ品質の向上
TeradataのBTEQユーティリティは、スクリプトの経験がある経験豊富なデータ管理者にとって以下の操作を可能にしてくれます。
- マクロの作成
- DDLステートメントの実行
- ステートメントの実行
- ストアドプロシージャの操作
これにより管理者は、特定の目的のためにレコードのテーブルを作成したり、以前は優先順位が低かったデータを深く掘り下げるなど、正確なデータ収集タスクを実行する際の柔軟性が向上します。また、「FastLoad」や「FastExport」でテーブルを作成し、そのデータをフラットファイルに変換することもできます。
MultiLoadでは、最大5つのテーブルを一度に扱うことができます。TeradataはRDBMS(Relational Database Management System)を使用してテーブルとデータをやりとりします。TPT(Teradata Parallel Transporter)は、BTEQやTPumpなどのTeradataの別のユーティリティをCallすることができます。
BTEQユーティリティでは、標準的なSQLコマンドの入力も可能で、各コマンドの先頭にピリオドを付けることで、そのコマンドをSQLクエリとして扱わないようにすることができます。
5. 強力なパートナーと一緒にデータ品質を向上させる
Teradataは、自社のデータマネジメントソリューションがすべての問題を解決するわけではないことを理解しています。そのため、Teradataは他の様々なデータ統合プロバイダと連携しています。皆さんにも馴染みのある連携対象は以下のとおりです。
- Microsoft Azure
- Amazon Web Services (AWS)
- Informatica(Informatica Power CenterでTeradata Accelerateと連携)
- IBM InfoSphere DataStage
- Oracle
ビジネスデータの可能性を最大限に引き出したい場合は、Teradataのような分析サービスとIntegrate.ioのETLツールを使用することで、データの収集や照合を欠かすことなく、データのあらゆる部分をレポート作成やインサイト分析に利用することができます。
まとめ
Teradataは強力なビッグデータツールですが、小規模から始めてデータマネジメントの選択肢を広げていきたいと考えている企業にとっては、完全なスケーラビリティを備えています。Teradataが現在注力しているのは、データを統合して深いインサイトを得ることであり、これを "Pervasive Data Intelligence "と呼んでいます。ユーザーはAb Initioでメタデータを実装し、パフォーマンスチューニングのためにSQLジョブを監視・把握することができます。
大量の非構造化データを管理できるHadoopのようなソリューションとは異なり、Teradataは構造化データでのみ真価を発揮します。そのため、まずデータを管理・構造化するETLツールが必要になります。
効果的なデータウェアハウスは、データ収集ツールとデータ統合ツールがあって初めて力を発揮します。 ETLツールはELT(extract, load, transfer)よりも効率的で、データウェアハウスのリソースに依存せずに変換を実行できます。効果的なETL処理ツールは、独自のクラウドベースのプラットフォームを介して、UnixからWindowsまで、あらゆるOS上で動作します。
Integrate.ioは、SaaSアプリケーション、データストア、およびソースシステムに対して100以上のデータ接続を提供します。
ETLおよびビジネスインテリジェンスツールがデータウェアハウスとどのように連携してデータマネジメントツールの優れたスイートを構築することができるかかについて興味がある方は、オンラインデモにお申し込みください。