米国マスメディア企業のデータ管理変革

続きを読む

目標

• 特定の分析データの主要セルフサービスポータルと置き場所としての役割を果たす

• 組織全体でデータの検索・分析を可能にする 

• 数々のステークホルダーのデータニーズに対応し、様々な技術レベルに対応する

• 迅速なビジネスインサイトとより深いデータサイエンスへの取り組みを可能にする

課題

• 当時のデータは、各部門間で共有ができていなかった

• 検索がセルフサービスではなかった 

• 背景や定義には、人が作業する必要があった

作業工程の重要ポイント

1. データ管理

目標は、分析プラットフォームの機能(デートサイエンスと機械学習)のための準備をするための「データアクセス 」と、アプリケーションから分離された 「データプロセス」とプラットフォームを確立することでした。

2. ビジネス知能と分析

Tableauなどのレイヤーツールを用いて、データの可視化を可能にしました。与えられたビジネス要件を可能にするために、些細なことでもすぐに確認できるレイヤーを構築しました。

3. 自動的・継続的な統合化

自動テスト、エラー追跡、アラートの導入と連動して、CI-CD駆動のデータ抽出、変換、負荷ルーチンを確立し、パフォーマンスを最適化しました。

4. クラウド・インターフェース

CI&Tは経済的で競争力のあるクラウド基盤の構築を推奨。拡張性の高いインフラストラクチャと高性能なETLとビジネス知能のレイヤーを提供しました。 

アーキテクチャ概要

Analytics Platformの背後にあるアーキテクチャは、クラウドベースのサービスや製品の上に構築されたカスタム要素で構成されています。これらの要素は、抽出、変換、ロードなどの様々なデータ操作ステップを管理する役割を担っています。また、プラットフォーム全体で簡単に再利用でき、より複雑なパイプラインを作成するために互いに接続できるように構築されています。

これらの要素は、ある場所から別の場所へデータを移行したり、あるフォーマットから別のフォーマットに変換したりする独立したサービスと考えることができます。あるステップの出力が別のステップの入力となることもあります。通常、すべてのパイプラインは、データがクラウドベースのデータウェアハウスソリューション内で完結するように構築されています。

Analytical Platform Architecture