Empresa americana de meios de comunicação de massa: Transformando a gestão de dados

Learn more

Metas

● Servir como um portal central de autoatendimento e repositório para dados analíticos específicos

● Permitir a recuperação e análise de dados em toda a organização 

● Atender às necessidades de dados das diferentes partes interessadas e abordar vários níveis de proficiência técnica

● Permitir insights de negócios rápidos e iniciativas de ciência de dados mais profundas

Desafios

● Os dados atuais existem em silos em toda a organização

● A recuperação não é por autoatendimento  

● Antecedentes e definições requerem interação humana

Pilares do fluxo de trabalho

1. Gestão de Dados 

O objetivo era estabelecer rotinas e plataformas de processo de dados separadas de métodos e aplicativos de acesso a dados para aumentar a prontidão para recursos de plataforma analítica — Ciência de Dados e Machine Learning. 

2. Inteligência e Análise Comerciais

Habilitamos o autoatendimento para visualização de dados usando ferramentas de camada de apresentação como o Tableau. Construímos uma camada onde itens menores podem ser revertidos rapidamente para habilitar qualquer requisito de negócio. 

3. Automação e Integração Contínuas 

Estabelecemos rotinas de extração, transformação e carregamento de dados orientadas por CI-CD em conjunto com a implantação de testes automatizados, rastreamento de erros e alertas para desempenho otimizado. 

4. Infraestrutura de Nuvem 

Recomendamos o estabelecimento de uma infraestrutura em nuvem que fosse econômica e competitiva. Ele fornece uma infraestrutura escalonável e camadas de ETL e Inteligência Comercial de alto desempenho. 

Visão Geral da Arquitetura

A arquitetura por trás da Plataforma de Análise é feita de componentes customizados, construídos sobre serviços e produtos baseados em nuvem. Eles são responsáveis por gerenciar uma variedade de etapas de manipulação de dados, como extração, transformação e carregamento, entre outras. Além de serem construídos de forma que possam ser facilmente reutilizados em toda a plataforma e conectados uns aos outros para criar pipelines mais complexos.

São componentes que atuam como serviços independentes que migram dados de um lugar para outro ou que se transformam de um formato para outro. A saída de uma etapa pode ser a entrada de outra etapa e assim por diante. Normalmente, todos os pipelines são construídos de forma que os dados terminem em uma solução de Armazém de Dados baseada em nuvem, que permite às empresas consultar e trabalhar com base nesses dados — o principal objetivo de negócios da Plataforma de Análise.