Boas práticas de governança: transformando dados em ativos de IA

Jul 07, 2025 | min leitura

Raphael Smith

Com a onda de transformações provocada pela Inteligência Artificial, empresas de todo o mundo passaram a colocar a relação com seus dados – e como extrair valor real deles – no centro das atenções. O interesse crescente dos executivos em olhar para os dados de forma mais estruturada tem motivo: a jornada de disrupção habilitada pela IA, especialmente pela IA generativa, depende diretamente da qualidade, do contexto e da rastreabilidade dessas informações.

Para Raphael Smith, Sr Data & AI Manager, a governança de dados é um habilitador essencial para gerar valor com GenAI, justamente por permitir que as empresas usem a inteligência artificial com mais contexto e, portanto, com mais precisão.

“Modelos fundacionais, como o GPT, são treinados com grandes volumes de informação da internet. Mas, quando uma empresa utiliza essas ferramentas, precisa alimentá-las com seus próprios dados para gerar contexto. É aí que surgem os desafios, porque o que torna esses dados relevantes é a qualidade da informação que está sendo fornecida”, afirma o executivo.

Esse movimento tem impulsionado uma evolução significativa na governança de dados, que hoje caminha para ser cada vez mais distribuída e ágil, permitindo que pessoas nas pontas do processo também contribuam ativamente.

Ou seja, a governança vem deixando de ser apenas um mecanismo de controle técnico e passa a assumir um papel de impacto no negócio, pois dá visibilidade à organização necessária para gerar valor com Inteligência Artificial.

Quando os dados viram risco: os perigos de uma governança frágil

É o que se costuma chamar de garbage in, garbage out. Se a entrada de dados é ruim, a saída será igualmente comprometida. Quando uma empresa alimenta a IA com informações incompletas, desatualizadas ou sem qualidade, os resultados tendem a gerar decisões falhas que, mais do que impactar a operação, podem prejudicar seriamente a reputação da companhia.

Raphael, aponta três riscos principais que empresas com baixa maturidade em governança enfrentam ao explorar as oportunidades da Inteligência Artificial.

O primeiro é o mais direto: a tomada de decisões erradas, fruto de dados de má qualidade. Isso acontece quando a empresa utiliza informações desatualizadas, parciais ou enviesadas, por exemplo, quando há excesso de dados sobre um determinado tema e escassez sobre outros, o que distorce as análises e conclusões da IA.

O segundo risco é a falta de explicabilidade e transparência, consequência de ambientes com baixa rastreabilidade dos dados (também conhecida como low lineage). Quando não se sabe exatamente onde a informação se origina, como ela é transformada e em quais condições chega até o modelo, perde-se a capacidade de compreender ou auditar os resultados.

“Quando a empresa não consegue rastrear os dados que alimentam a IA, ela também perde a confiança dos usuários. Em ambientes regulatórios, isso dificulta auditorias e inviabiliza revisões éticas”, reforça o executivo.

O último risco citado pelo especialista está na dificuldade de escalar. Embora pequenas POCs (provas de conceito) criadas com conjuntos limitados de dados possam mostrar resultados promissores, na hora de levar esses projetos para a operação real com metadados de clientes, produtos e processos, os gargalos aparecem. Sem governança, o salto da experimentação para o impacto em escala fica comprometido.

6 boas práticas de governança de dados que garantem qualidade nos projetos de IA

Para evitar os perigos provocados pela governança de dados frágil, algumas práticas podem e devem ser adotadas pelas empresas.

01. Discovery

Implantar um catálogo de dados com a indicação de onde encontrar cada informação e o que cada uma quer dizer. Desta forma, é possível saber se as informações que estão sendo usadas são de fato o que a empresa precisa e o que elas significam.

02. Implementação de um glossário

Um glossário padroniza os dados com termos de negócio. Isso evita casos em que os dados deveriam falar a mesma coisa, mas possuem IDs diferentes, por exemplo: em uma fonte a região é chamada de “MX”, e em outra é “México”.

03. Automatização da validação de qualidade

Ao longo do pipeline de dados, a informação é levada de uma origem para um repositório, também conhecido como data lake. Depois dessa ação, é necessário ter observalidade, ou seja, saber o que está acontecendo dentro desse fluxo de dados para entender se a informação está fluindo com qualidade; o que pode ser feito automatizando as validações com testes unitários e integrados com todos os dados.

04. Alertas automatizados

É possível automatizar alertas quando uma informação incompleta é importada para os data lakes. Essa boa prática permite que a qualidade das informações se mantenha boa ao longo do tempo.

05. Policy as a code

Em uma esfera mais técnica, as políticas como código possibilitam embutir as regras de segurança que as informações precisam ter enquanto se está escrevendo o código, de forma integrada no pipeline de dados.

06. Ações ativas de metadados

Identificar duplicidades, sugerir novas classificações, entre outras ações realizadas de forma pró-ativa.

Raphael lembra ainda que a tecnologia não é apenas a beneficiária de uma boa governança, mas também é parte da solução. A Inteligência Artificial pode apoiar a estruturação das informações que, por sua vez, permitem que ela funcione com mais precisão, contexto e confiança. Além disso, existe um arsenal de ferramentas para catálogo de dados, monitoria e observabilidade, rastreabilidade e gestão de data quality.

“Com tantas tecnologias para dar apoio à governança de dados, um dos maiores obstáculos das as empresas acaba sendo o legado tecnológico. Muitas vezes existem sistemas que as equipes não sabem que estão lá e muito menos como funcionam”, afirma.

Apoio estratégico para implementação de governança de dados

Mais do que desenvolver data hubs, implementar ferramentas de apoio à governança e modernizar sistemas legados, a CI&T atua de forma estratégica com empresas que procuram navegar nas oportunidades habilitadas pela Inteligência Artificial.

A multinacional brasileira utiliza um framework proprietário para entender o nível de maturidade e governança de seus clientes e, com base nessa avaliação, cria a estratégia e roadmap de implementação customizado para cada empresa, considerando tanto a estratégia para alteração de processo, quanto a implementação técnica das ferramentas de governança.

“No fim do dia, a governança dá base para a Inteligência Artificial, e a Inteligência Artificial dá base pro negócio. Então, é uma conversa só: oportunidade, tomada de decisão baseada em dados e mudança de cultura, e nós apoiamos essa transformação de ponta a ponta”, finaliza Raphael.

Raphael Smith

Sr. Data & AI Manager na CI&T